Hadoop学习之MapReduce（MapTask和ReduceTask源码）心得

顺其自然的济帅哈

已于 2022-06-05 11:00:24 修改

阅读量757

点赞数

分类专栏： Hadoop 文章标签： mapreduce hadoop

于 2022-03-05 16:18:18 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ljs_0/article/details/123296538

版权

Hadoop 专栏收录该内容

15 篇文章 1 订阅

订阅专栏

MapTask 源码解析（DEBUG步骤）：

1. context.write() 自定义的map方法的写出，进入

2. output.write() 收集方法，进入两次

3. collector.collect() 收集器

4. HashPartitioner 默认分区器

5. collect() map端所有的kv全部写出后走下面的close方法

6. collector.flush() 溢出刷写方法

7. sortAndSpill() 溢写排序

8. sorter.sort() 溢写排序方法

9. mergeParts() 合并文件

10. collector.close() 收集器关闭，进入ReduceTask

ReduceTask 源码解析（DEBUG步骤）：

   1. if(isMapOrReduce())   搜索，提前打断点

   2. initialize()        进入

3. init(shuffleContext) 提前给下面打断点

totalMaps = job.getNumMapTasks() ShuffleSchedulerImpl 第120行

merger = createMergeManager(context) Shuffle 第80行

MergeManagerImpl 第232和235行

this.inMemoryMerger = createInMemoryMerger(); 内存合并

this.onDiskMerger = new OnDiskMerger(this); 磁盘合并

4. rIter = shuffleConsumerPlugin.run()

eventFetcher.start(); 抓取数据，Shuffle 107行提前断点

eventFetcher.shutDown(); 抓取结束，Shuffle 141行提前断点

copyPhase.complete(); copy阶段完成，Shuffle 151行

5. taskStatus.setPhase(TaskStatus.Phase.SORT) 开始排序阶段，Shuffle 152行

6. sortPhase.complete(); 排序阶段完成，进入reduce阶段 reduceTask 382行

7. reduce(); 调用自定义reduce方法，多次调用

8. cleanup(context); reduce完成之前最后调用一次Reducer里面的cleanup方法

顺其自然的济帅哈

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
Hadoop学习之MapReduce（MapTask和ReduceTask源码）心得

MapTask和ReduceTask源码
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

顺其自然的济帅哈 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。