hadoop入门教程-核心组件MR

hadoop分布式计算框架--mapReduce,简称MR(离线计算),设计理念为:

----何为分布式计算;

----移动计算,而不是移动数据;

提到mapReduce,我们先来了解它的架构:

* 首先是一个一主多从架构;

* 其次,主要有主 jobTracker和从TaskTracker两部分;其中jobTracker负责调度分配每一个子任务task运行于taskTracker上,如果发现有失败的task就重新分配其任务到其他节点,每一个hadoop集群中只有一个jobTracker,一般它运行在master节点上。

taskTracker主动与jobTracker通信,接收作业,并负责直接执行每一个任务,为了减少网络带宽TaskTracker最好运行在hdfs的datanode上;

具体处理流程和框架如下:




  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值