Mapreduce学习（二）——mr程序提交的流程+yarn框架的资源调度

最新推荐文章于 2024-04-26 22:48:32 发布

BUG世界中的killer

最新推荐文章于 2024-04-26 22:48:32 发布

阅读量621

点赞数 1

分类专栏： hadoop从0开始文章标签： hadoop mapreduce yarn 运行机制

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_32695789/article/details/85011661

版权

hadoop从0开始专栏收录该内容

14 篇文章 0 订阅

订阅专栏

上篇文章简单写了一个mr程序并且提交至咱们的集群中运行。这篇文章给大家带来mr具体的流程以及进程的变化过程

我们运行sh.start-all.sh 时进程会出现

其中DataNode、NameNode、SecondaryNameNode属于HDFS的进程用于管理文件存储

ResourceManager（下面称RM）和NodeManager（下面称NM）属于yarn框架的进程

一、提交job

1）运行job的jar文件：hadoop jar xxx.xx.xx.WordCountRunner

这个main方法中最后一步提交job至集群：job.waitForCompletion()方法这个时候进程会出现一个RunJar的进程

2）RunJar向RM申请执行一个job，RM会返回job相关资源以及jobID

3）RunJar会将这些资源提交至HDFS并且将提交结果信息返回RM

4）RM将job添加至job队列中

二、初始化

1）RM初始化job任务

2）NM从RM领取job

3）NM分配资源容器（包括IO资源、磁盘资源、网络资源、内存资源等等）

三、mapreduce

1）RM在某个NM节点上启动MRAppMaster（mr主要进程）

2）master向RM注册job

3）master给其他NM上分配MapTask从而产生yarnChild（进行map计算）

4）map计算结束之后将结果给reduce的NM节点进行分析整合

5）将结果写入HDFS

6）master向RM注销自己结束进程

下一篇文章（周日发布）将会带来如何在本地DEBUG 调试Mapreduce程序

本人QQ/Wechat:806751350

github地址：https://github.com/linminlm

BUG世界中的killer

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
Mapreduce学习（二）——mr程序提交的流程+yarn框架的资源调度

上篇文章简单写了一个mr程序并且提交至咱们的集群中运行。这篇文章给大家带来mr具体的流程以及进程的变化过程我们运行sh.start-all.sh 时进程会出现其中DataNode、NameNode、SecondaryNameNode属于HDFS的进程用于管理文件存储ResourceManager（下面称RM）和NodeManager（下面称NM）属于yarn框架的进程一、提交...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。