MapReduce运行机制(一) 剖析MR作业运行机制

剖析MR作业运行机制submit() 提交作业,封装大量处理细节waitForCompletion() 提交未提交过的作业并等待完成MR作业过程:1) 客户端:提交MapReduce作业2) YARN Resource Manager,协调集群资源分配3) YARN Node Manager,启动和监控集群计算容器4) MapReduce application master,协调运行MR作任务。...
摘要由CSDN通过智能技术生成

剖析MR作业运行机制


MR作业:

1) 客户端:提交MapReduce作业

2) YARN Resource Manager,协调集群资源分配

3) YARN Node Manager,启动和监控集群计算容器

4) MapReduce application master,协调运行MR作任务。和MR任务在容器中运行,容器由RM分配,NM启动,监控和管理

5) HDFS 与其他实体间共享作业文件


提交作业

Job的submit()方法创建JobCommitter的实例,并调用submitJobInternal()。提交作业后,waitForCompletion()每秒轮询作业进度,如果与上次报告有改变,则将进度报告到控制台。完成后如果成功,显示Counter,如果失败,显示错误详细信息。


Jobcommitter作业提交过程:

1) 向RM申请新的application ID, 用于MR Job ID

2) 检查作业的输出说明,有错误则抛出给MR程序,无错误则提交

3) 计算作业的输入分片,有错误则抛出给MR程序

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值