MapReduce的Job提交运行流程

最新推荐文章于 2022-04-24 19:06:02 发布

Gao__xi

最新推荐文章于 2022-04-24 19:06:02 发布

阅读量235

点赞数

分类专栏：大数据文章标签： MapReducer

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Gao__xi/article/details/88828954

版权

大数据专栏收录该内容

12 篇文章 0 订阅

订阅专栏

运行图

在这里插入图片描述

客户端通过hadoop -jar的形式，运行写好的MR程序
2.客户端将任务提交到ResourceManager，并获取ResourcesManage返回的一个JobID
3.客户端得到JobId后将
①根据指定的路径，到HDFS上获取文件
②对文件进行切片，并记录切片信息
③分片信息复制到HDFS文件系统上
客户端将信息提交到HDFS上后，通知ResourcesManager运行该JobID的任务
a.resourcemanager会找空闲的nodemanager
b.在此空闲NodeManager上启动一个MRApplicationMaster，用于Job任务的具体划分
mrappmaster 会初始化这个job任务，
mrappmaster会从hdfs上获取这个job的切块信息，以此来判断需要几个
MapTask和ReduceTask
mrappmaster划分好任务后，会请求Resourcesmanager分配资源。RM会返回一个Container，里面是分配的资源（就是让哪个节点执行哪个任务）
a.mrappmaster根据ResourcesManager分配的NodeManager上分配具体的任务
b.相应的NodeManager节点收到此消息后，会开启一个JVM
开启JVM后，会启动一个YarnChild线程，YarnChild去HDFS获取相应的分片信息 11. YarnChild线程启动MapTask或者ReduceTask（具体看分配的是啥了）

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
MapReduce的Job提交运行流程

运行图客户端client运行job任务（就是我们写好的Java程序，点击运行），之后，会为我我们检查路径，配置之类的错误出错了，就在控制台报了异常。成功后生成一个Job任务，此时向 resourcemanager申请提交次Job。resourcemanager会为此任务返回一个JobID，并告诉这个job，把job自己的资源，jar，配置信息发送到hdfs上Job得到这个响应了，自然将...
复制链接

扫一扫

专栏目录

Gao__xi CSDN认证博客专家 CSDN认证企业博客

码龄6年

46: 原创

4万+: 周排名

3万+: 总排名

4万+: 访问

: 等级

867: 积分

50: 粉丝

62: 获赞

5: 评论

96: 收藏

私信

关注

热门文章

分类专栏

最新评论

Bean的生命周期
CSDN-Ada助手: 推荐 CS入门技能树：https://edu.csdn.net/skill/gml?utm_source=AI_act_gml
NIO中Selector中select()的不成熟的理解
起手落码: 你好博主，这边我打断点，会在 select() = 0的时候进入 while 循环，这是为什么呢
Python爬虫实战（2）之爬取NBA球队各个球员头像图片
Gao__xi: 之前玩的时候可以，现在已经好久没玩了，而且爬虫很少用这套爬了。
Python爬虫实战（2）之爬取NBA球队各个球员头像图片
JM_BI: 请问现在还爬的了嘛？我尝试了一下，没有报错，但没有爬取下来
HashMap和HashTable线程安全性验证
qq_35617976: 为什么size会是2啊

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。