久久精品国产亚洲高清|精品日韩中文乱码在线|亚洲va中文字幕无码久|伊人久久综合狼伊人久久|亚洲不卡av不卡一区二区|精品久久久久久久蜜臀AV|国产精品19久久久久久不卡|国产男女猛烈视频在线观看麻豆

    1. <style id="76ofp"></style>

      <style id="76ofp"></style>
      <rt id="76ofp"></rt>
      <form id="76ofp"><optgroup id="76ofp"></optgroup></form>
      1. 千鋒教育-做有情懷、有良心、有品質的職業(yè)教育機構

        手機站
        千鋒教育

        千鋒學習站 | 隨時隨地免費學

        千鋒教育

        掃一掃進入千鋒手機站

        領取全套視頻
        千鋒教育

        關注千鋒學習站小程序
        隨時隨地免費學習課程

        當前位置:首頁  >  行業(yè)資訊  > 千鋒大數(shù)據(jù)培訓分享2018常見大數(shù)據(jù)面試題總結

        千鋒大數(shù)據(jù)培訓分享2018常見大數(shù)據(jù)面試題總結

        來源:千鋒教育
        發(fā)布人:千鋒老師
        時間: 2018-10-31 14:17:00 1540966620

          千鋒大數(shù)據(jù)培訓老師整理的純干貨總結:2018常見大數(shù)據(jù)面試題,助正在找工作的小伙伴一臂之力!

        圖片1

          1、RDD中reduceBykey與groupByKey哪個性能好,為什么

          reduceByKey:reduceByKey會在結果發(fā)送至reducer之前會對每個mapper在本地進行merge,有點類似于在MapReduce中的combiner。這樣做的好處在于,在map端進行一次reduce之后,數(shù)據(jù)量會大幅度減小,從而減小傳輸,保證reduce端能夠更快的進行結果計算。

          groupByKey:groupByKey會對每一個RDD中的value值進行聚合形成一個序列(Iterator),此操作發(fā)生在reduce端,所以勢必會將所有的數(shù)據(jù)通過網絡進行傳輸,造成不必要的浪費。同時如果數(shù)據(jù)量十分大,可能還會造成OutOfMemoryError。

          通過以上對比可以發(fā)現(xiàn)在進行大量數(shù)據(jù)的reduce操作時候建議使用reduceByKey。不僅可以提高速度,還是可以防止使用groupByKey造成的內存溢出問題。

          2、講述一下hdfs上傳文件的流程。

          答:這里描述的 是一個256M的文件上傳過程

          ① 由客戶端 向 NameNode節(jié)點節(jié)點 發(fā)出請求;

         ?、贜ameNode 向Client返回可以可以存數(shù)據(jù)的 DataNode 這里遵循機架感應原則;

         ?、劭蛻舳?首先 根據(jù)返回的信息 先將 文件分塊(Hadoop2.X版本 每一個block為 128M 而之前的版本為 64M;

          ④然后通過那么Node返回的DataNode信息 直接發(fā)送給DataNode 并且是 流式寫入同時會復制到其他兩臺機器;

         ?、載ataNode 向 Client通信 表示已經傳完 數(shù)據(jù)塊 同時向NameNode報告 ⑥依照上面(④到⑤)的原理將 所有的數(shù)據(jù)塊都上傳結束 向 NameNode 報告 表明 已經傳完所有的數(shù)據(jù)塊 。

          3、了解zookeeper嗎?介紹一下它,它的選舉機制和集群的搭建。

          答:那當然是熟悉啦,ZooKeeper 是一個開源的分布式協(xié)調服務,是 Google Chubby 的開源實現(xiàn)。分布式應用程序可以基于 ZooKeeper 實現(xiàn)諸如數(shù)據(jù)發(fā)布/訂閱、負載均衡、命名服務、分布式協(xié)調/通知、集群管理、Master 選舉、分布式鎖和分布式隊列等功能。我們公司使用的flume集群,Kafka集群等等,都離不開ZooKeeper呀。每個節(jié)點上我們都要搭建ZooKeeper服務。首先我們要在每臺pc上配置zookeeper環(huán)境變量,在cd到zookeeper下的conf文件夾下在zoo_simjle.cfg文件中添加datadir路徑,再到zookeeper下新建data文件夾,創(chuàng)建myid,在文件里添加上server的ip地址。在啟動zkserver.sh start便ok了。

          4、spark streming在實時處理時會發(fā)生什么故障,如何停止,解決

          答:和Kafka整合時消息無序:

          修改Kafka的ack參數(shù),當ack=1時,master確認收到消息就算投遞成功。ack=0時,不需要收到消息便算成功,高效不準確。sck=all,master和server都要受到消息才算成功,準確不高效。

          StreamingContext.stop會把關聯(lián)的SparkContext對象也停止,如果不想把SparkContext對象也停止的話可以把StremingContext.stop的可選參數(shù)stopSparkContext設為flase。一個SparkContext對象可以和多個streamingcontext對象關聯(lián)。只要對前一個stremingcontext.stop(stopsparkcontext=false),然后再創(chuàng)建新的stremingcontext對象就可以了。

        tags:
        聲明:本站稿件版權均屬千鋒教育所有,未經許可不得擅自轉載。
        10年以上業(yè)內強師集結,手把手帶你蛻變精英
        請您保持通訊暢通,專屬學習老師24小時內將與您1V1溝通
        免費領取
        今日已有369人領取成功
        劉同學 138****2860 剛剛成功領取
        王同學 131****2015 剛剛成功領取
        張同學 133****4652 剛剛成功領取
        李同學 135****8607 剛剛成功領取
        楊同學 132****5667 剛剛成功領取
        岳同學 134****6652 剛剛成功領取
        梁同學 157****2950 剛剛成功領取
        劉同學 189****1015 剛剛成功領取
        張同學 155****4678 剛剛成功領取
        鄒同學 139****2907 剛剛成功領取
        董同學 138****2867 剛剛成功領取
        周同學 136****3602 剛剛成功領取
        相關推薦HOT
        PMP?認證榮獲北京市境外職業(yè)資格認可!

        北京市人力資源和社會保障局、北京市人才工作局近日發(fā)布了關于印發(fā)《北京市境外職業(yè)資格認可目錄(3.0版)》的通知,新版目錄境外職業(yè)資格清單...詳情>>

        2023-09-07 17:27:00
        怎么選擇靠譜的短視頻運營培訓機構?

        怎么選擇靠譜的短視頻運營培訓機構?5G時代的來臨,短視頻作為新媒體中最為主流的內容更加方便用戶瀏覽觀看信息,因此抖音、快手這類的短視頻平...詳情>>

        2023-09-07 15:05:06
        全媒體短視頻運營好就業(yè)么?

        全媒體短視頻運營好就業(yè)么?現(xiàn)在學習互聯(lián)網運營可不能只會單個的運營技術,企業(yè)更喜歡全能型人才。如今的互聯(lián)網世界有多種平臺,新媒體、短視頻...詳情>>

        2023-09-07 14:49:25
        短視頻運營培訓機構有用嗎?

        短視頻運營培訓機構有用嗎?短視頻的火熱,催生了一大批的網絡紅人、網紅賬號,這些短視頻賬號通過實現(xiàn)粉絲流量變現(xiàn),獲得了非常豐厚的收入,自...詳情>>

        2023-09-06 13:49:12
        大數(shù)據(jù)分析就業(yè)高薪崗位介紹

        大數(shù)據(jù)分析就業(yè)高薪崗位介紹?大數(shù)據(jù)行業(yè)是一個快速發(fā)展的行業(yè),其主要特征是數(shù)據(jù)規(guī)模龐大、種類多樣、處理復雜。目前,大數(shù)據(jù)行業(yè)已經成為全球...詳情>>

        2023-09-06 13:42:47
        開班信息
        北京校區(qū)
        • 北京校區(qū)
        • 大連校區(qū)
        • 廣州校區(qū)
        • 成都校區(qū)
        • 杭州校區(qū)
        • 長沙校區(qū)
        • 合肥校區(qū)
        • 南京校區(qū)
        • 上海校區(qū)
        • 深圳校區(qū)
        • 武漢校區(qū)
        • 鄭州校區(qū)
        • 西安校區(qū)
        • 青島校區(qū)
        • 重慶校區(qū)
        • 太原校區(qū)
        • 沈陽校區(qū)
        • 南昌校區(qū)
        • 哈爾濱校區(qū)
        吉木萨尔县| 和顺县| 酒泉市| 镇平县| 新化县| 昔阳县| 新泰市| 绵竹市| 长汀县| 灵山县| 扶沟县| 巴青县| 塘沽区| 扶余县| 富平县| 沐川县| 图片| 淮南市| 公主岭市| 盐亭县| 白银市| 夹江县| 抚州市| 贞丰县| 张家港市| 南阳市| 镇坪县| 绥棱县| 榆中县| 正安县| 漯河市| 阿拉善左旗| 安宁市| 铜川市| 富阳市| 南安市| 石棉县| 宾阳县| 永春县| 都兰县| 七台河市|