hadoop是什么意思

36氪企服點評小編

2022-03-21 11:42

2306次閱讀

| 企服解答

Hadoop是一個由Apache基金會所開發(fā)的分布式系統(tǒng)基礎(chǔ)架構(gòu)。用戶可以在不了解分布式底層細節(jié)的情況下，開發(fā)分布式程序。充分利用集群的威力進行高速運算和存儲。Hadoop實現(xiàn)了一個分布式文件系統(tǒng)（HadoopDistributedFileSystem），簡稱HDFS。HDFS有高容錯性的特點，并且設(shè)計用來部署在低廉的（low-cost）硬件上；而且它提供高吞吐量（highthroughput）來訪問應(yīng)用程序的數(shù)據(jù)，適合那些有著超大數(shù)據(jù)集（largedataset）的應(yīng)用程序。Hadoop有高可靠性、高擴展性、高效性、高容錯性、低成本五個特點。

hadoop是什么意思

1、高可靠性

Hadoop按位存儲和處理數(shù)據(jù)的能力值得人們信賴。

2、高擴展性

Hadoop是在可用的計算機集簇間分配數(shù)據(jù)并完成計算任務(wù)的，這些集簇可以方便地擴展到數(shù)以千計的節(jié)點中。

3、高效性

Hadoop能夠在節(jié)點之間動態(tài)地移動數(shù)據(jù)，并保證各個節(jié)點的動態(tài)平衡，因此處理速度非常快。

4、高容錯性

Hadoop能夠自動保存數(shù)據(jù)的多個副本，并且能夠自動將失敗的任務(wù)重新分配。

5、低成本

與一體機、商用數(shù)據(jù)倉庫以及QlikView、Yonghong Z-Suite等數(shù)據(jù)集市相比，hadoop是開源的，項目的軟件成本因此會大大降低。

| 拓展閱讀

Hadoop大數(shù)據(jù)處理的意義：

Hadoop得以在大數(shù)據(jù)處理應(yīng)用中廣泛應(yīng)用得益于其自身在數(shù)據(jù)提取、變形和加載(ETL)方面上的天然優(yōu)勢。Hadoop的分布式架構(gòu)，將大數(shù)據(jù)處理引擎盡可能的靠近存儲，對例如像ETL這樣的批處理操作相對合適，因為類似這樣操作的批處理結(jié)果可以直接走向存儲。Hadoop的MapReduce功能實現(xiàn)了將單個任務(wù)打碎，并將碎片任務(wù)(Map)發(fā)送到多個節(jié)點上，之后再以單個數(shù)據(jù)集的形式加載(Reduce)到數(shù)據(jù)倉庫里。

[免責(zé)聲明]

文章標(biāo)題： hadoop是什么意思

文章內(nèi)容為網(wǎng)站編輯整理發(fā)布，僅供學(xué)習(xí)與參考，不代表本網(wǎng)站贊同其觀點和對其真實性負責(zé)。如涉及作品內(nèi)容、版權(quán)和其它問題，請及時溝通。發(fā)送郵件至36dianping@36kr.com，我們會在3個工作日內(nèi)處理。

hadoop是什么意思

項目管理SaaS為什么很難一家獨大？答案藏在中小企業(yè)的痛點里

2021年玩私域：不懂這些你就OUT了！

企業(yè)為什么要買SaaS？| 專家視角

SCRM如何幫助李佳琦們布局私域流量？

“救命文檔”打破信息孤島，讓受災(zāi)群眾不再成為“孤島”