Hadoop之MapReduce和Yarn内核源码解析

六块腹肌的程序猿

已于 2022-05-27 19:43:34 修改

阅读量1k

点赞数 2

文章标签： hadoop mapreduce big data

于 2022-05-27 19:40:54 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44468025/article/details/124984533

版权

前言：此文章从客户端提交job任务开始，到对需要处理的数据进行切片，产生对应的maptask任务，Yarn来管理任务的调度来执行maptask和reducetask（包括shuffle）进行了详细的代码分析。

一、hadoop的Job 提交流程源码

流程图：
在这里插入图片描述

1.从我们编写的mapreduce的代码中进入job提交源码
在这里插入图片描述

支线一：进入connect();

2.支线二：进入submitter.submitJobInternal(Job.this, cluster)，向集群提交了job信息，这里是提交job任务的核心代码

在这里插入图片描述
该方法（submitter.submitJobInternal(Job.this, cluster)）往下翻：

存入了切片信息的本地路径
在这里插入图片描述
submitter.submitJobInternal(Job.this, cluster)方法继续往下走

该方法继续往下看：将job的任务创建的Application的appContext上下文信息发送到Yarn的ResourseManager

最低0.47元/天解锁文章

六块腹肌的程序猿

关注

2
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
Hadoop之MapReduce和Yarn内核源码解析

前言：此文章从客户端提交job任务，到对需要处理的数据block进行切片，产生对应的maptask任务，Yarn来管理任务的调度来执行maptask和reducetask进行了详细解读。一、hadoop的Job 提交流程源码流程图：1.从我们编写的mapreduce的代码中进入job提交源码支线一：进入connect();2.支线二：进入submitter.submitJobInternal(Job.this, cluster)，向集群提交了job信息，这里是提交job任务的核心代码
复制链接

扫一扫

六块腹肌的程序猿 CSDN认证博客专家 CSDN认证企业博客

码龄5年

67: 原创

7万+: 周排名

222万+: 总排名

6万+: 访问

: 等级

810: 积分

112: 粉丝

41: 获赞

12: 评论

307: 收藏

私信

关注

热门文章

分类专栏

笔记 21篇

最新评论

JVM【类的加载过程（类的生命周期）详解】
CSDN-Ada助手: 亲爱的博主，非常感谢您的分享！您的文章令人受益匪浅，简洁明了地讲解了JVM的类加载过程，为读者打开了新的认知视角。我相信您是一位兢兢业业的博主，真诚地向读者分享了自己的心得体会。鉴于您对JVM知识的深入理解和讲解能力，我认为您可以考虑探讨一下“JVM调优实践”这个话题，分享一些优化JVM性能的实用技巧和经验。希望您能够继续创作优质的博客，为广大读者带来更多收获和启迪！
Flink学习
彪悍程序员: 大佬能分享一些flink开发经验相关的文章吗
Linux三剑客
精通rm -rf *: wiki更新下
Hadoop源码解析
Rocket798: 牛！大佬可以分享一下看源码的方法吗？
Python学习
高峰君主: 收藏了，写的不错

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。