認識Hadoop

hadoop專案包括一些相關的子專案

core:核心分佈式管理系統

avro:一個有效率的,跨平台的,遠端程式呼叫資料序列化系統

mapredce:分佈式資料處理系統

HDFS:一個分佈式檔案管理系統

pig:處理大量資料流的語言與執行環境

HBase:一個以列為導向的分佈式資料庫系統

Zookeeper:一個分數式協同系統

Hive:分散式倉庫系統,管理HDFS儲存的資料并提供sql為基礎的查詢語言

Chukwa:一個分散式資料收集系統

基本上Hadoop可以分為運算和存儲兩大部份,前者有MapReduce負責,後者有HDFS負責。

運算過程mapredce分為兩個節點,JobTracker和TaskTracker,前者主要負責接收工作請求,處理分配任務給後者執行,并將執行完的資料整理傳回。

存儲部份分為兩個節點:NameNode和DataNode。

Hadoop是默認是FIFO Scheduler,也提供Fair Scheduler。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值