欧美麻豆久久久久久中文_成年免费观看_男人天堂亚洲成人_中国一级片_动漫黄网站免费永久在线观看_国产精品自产av一区二区三区

中培偉業IT資訊頻道
您現在的位置:首頁 > IT資訊 > 大數據 > 從基礎到深度解析Hadoop與Spark

從基礎到深度解析Hadoop與Spark

2017-02-06 16:53:12 | 來源:中培企業IT培訓網

Hadoop與Spark是當前兩個流行的大數據架構,也是非常重要的開源技術。對于Hadoop與Spark,業內很多專業人士都進行了對比分析。中培偉業《大數據平臺搭建與高性能計算最佳實踐》培訓蔣老師在這里就Hadoop與Spark兩大架構的認識發表了自己的看法。

Hadoop——Apache Hadoop 是受Google 的兩篇Paper( Mapreduce , Google File System )啟發誕生的。最早在Nutch項目里,2006年移入Hadoop,命名也成為行業內的一段談資。

Hadoop 主要包括兩步分,** Hadoop Distributed File System (HDFS) Hadoop MapReduce**。很 明顯了HDFS解決了存儲,MapReduce 更多情況下是一個編程框架。入門者最開始使用MapReduce 的例子基本都是進行詞頻統計。使用Map進行分詞,然后Reduce得到詞頻。

那經常聽到的Hive,Hbase 是什么? Hive 是建立在Hadoop 之上的數據倉庫,可以通過Sql查詢和實現一些MapReduce 操作。 Hbase 是建立在Hadoop之上的一種分布式非關系型數據庫。模型也是產生于Google的一篇research Bigtable: A Distributed Storage System for Structured Data 。用過的Cassandra也是一種Bigtable的實現。

你可能會聽到 Hadoop YARN ,YARN 是作業管理框架,蔣老師認為MapReduce 是建立在YARN上的。

Spark——在Spark 出來之后看到有人說Spark會代替Hadoop 。但經老師根據自己的認識給出了不同的觀點。蔣老師指出, Spark 的重點在于數據的處理和計算能力,它并沒有解決數據存儲問題。換句話說它相當于Hadoop Mapreduce的升級版。通常Spark都是和Hadoop 一起使用的。因為Spark需要HDFS這樣的存儲系統,Spark又比Hadoop Mapreduce 更快,個人感覺Api更豐富,對于機器學習算法來說更友好。 當然Spark 可以不需要Hadoop ,Hadoop 也可以不需要Spark. Spark 還提供了Spark Sql, Spark Stream,Spark Mlib, Spark GraphX 一些豐富的功能,而且支持Java, Scala, Python,R等多種語言。

標簽: 大數據平臺
主站蜘蛛池模板: 亚洲精品国偷自产在线99正片 | 久久精品国产99精品最新 | 亚洲欧洲AV综合一区二区三区 | 中文字幕一区二区三区人妻少妇 | 三个男吃我奶头一边一个视频 | 久热热国产久热 | 男人进入女人下部图 | 免费国精产品自偷自偷免费看 | 一区二区三区国产精品保安 | 爆乳3把你榨干哦ova在线观看 | 免费观看欧美成人AA片爱我多深 | 一区二区三区国产最好的精华液 | 中文字幕人妻被公上司喝醉 | 爆乳肉体大杂交soe646在线观看 | 67PAO国产成视频永久免费 | 国产无遮挡又黄又爽不要VIP软件 | 蜜桃免费在线视频 | 亚洲国产成人综合精品 | 日本无遮挡边做边爱边摸 | 免费A级毛片无码免费视频首页 | 亚洲成AV人片在线观看无线 | 无码国产精品久久一区免费 | 欧美国产成人激情视频在线观看 | 日本少妇被黑人猛cao | 国产黄色片麻豆 | 婷婷激情综合色五月久久图片 | 少妇无码av无码专线区大牛影院 | 人妻插B视频一区二区三区 亚洲成片在线观看12345ba | ww欧日韩视频高清在线 | 日本免费极度色诱福利视频 | 欧美性生交片4 | 狠狠干狠狠色 | 人妻无码中文字幕永久有效视频 | 啦啦啦资源在线观看视频 | 国产精品高潮呻吟爱久久AV无码 | 小荡货好紧好爽A片视频 | 久久久老熟女一区二区三区 | 中文字幕一区二区三区色视频 | 九九在线中文字幕无码 | 精品久久8X国产免费观看 | 在线视频 国产一区 |