mapReduce job的提交流程

举一个非常简单的例子,通过mapreduce计算单词数量,下面为相关代码:

1)准备环境,创建一个java工程,导入相关hdfs jar包,这些so easy 不在复述。

2)首先我们都知道mapreduce框架,经过2个阶段,一个map阶段一个reduce阶段,所以我们首先要创建一个map来整理我们的单词和数量然后通过reduce来计算我们的单词相关总数。相关代码如下:


我们可以把上面工程打成jar包,然后在我们hadoop环境中执行,此时我们可以通过jps命令查看相关进程。执行过程如下图




由上图客户端执行mian函数启动,此时启动runjar进程,整理我们所要处理的文件信息,并将这些信息提交给resourceManager框架,resourceManager得知客户端请求,经过处理返回给客户端一个jobId,和提交job的hdfs的文件路径,客户端得知路径将hdfs相关文件提交给job,通过yarn进行资源调度,将返回的job信息加入到resourceManage的执行队列中,nodeManager执行检测resourceManage job情况,通过yarn调度分配nodeManager资源计算空间然后汇报resourceManger创建情况,然后resourceManager启动mrAppMaste进程,然后从resourceManager中获取资源信息,mapTask进行业务计算,然后启动reduceTask进程进行整理计算结果,然后将结果反馈给resourcemanager,将结果写入文件。在此过程中相关进程如果闲置将自动消亡。

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值