mapreduce原理全剖析map+shuffle+reducer 全部过程

最新推荐文章于 2021-10-16 20:05:26 发布

a920259310

最新推荐文章于 2021-10-16 20:05:26 发布

阅读量3.8k

点赞数

分类专栏： mapreduce详解

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/a920259310/article/details/51156303

版权

mapreduce详解专栏收录该内容

2 篇文章 0 订阅

订阅专栏

1.mapreduce原理全剖析map+shuffle+reducer 全部过程

wordcount为例

1.mapper开始运行，调用InputFormat组件读取文件逻辑切片（逻辑切片不是block块，切片大小默认和block块大小相同）

2.经过inputformat组件处理后，文件以<k,v>的形式进入我们自定义的mapper逻辑

3.mapper逻辑中输出结果会调用OutPutCollector组件写入环形缓冲区。

4.环形缓冲区的存储达到默认阀值会调用Spliller组件将内容分区且排序（快排算法，外部排序算法）后溢写到磁盘文件中，mapper组后结果不满环形缓冲区也会溢写到磁盘。

5.mapper结束后磁盘中的结果小文件会合并（merge），产生大文件（分区且排序，归并算法）。

6.reducer启动后会到不同的map结果文件中下载相同区号的结果文件，再合并这些来自不同map的结果文件，再将这些文件合并（归并算法），产生的大文件是分区且排序且分好组了的，分组调用默认的GroupingComparator组件。

7.reducer把下载的所有map输出文件合并完成之后就会开始读取文件，将读入的内容以<k,v>的形式输入到我们用户自定义的reducer处理逻辑中。

8.用户逻辑完成之后以<k,v>的形式调用OutPutFormat组件输出到hdfs文件系统中去保存。

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
mapreduce原理全剖析map+shuffle+reducer 全部过程

1.mapreduce原理全剖析map+shuffle+reducer 全部过程 wordcount为例 1.mapper开始运行，调用InputFormat组件读取文件逻辑切片（逻辑切片不是block块，切片大小默认和block块大小相同） 2.经过inputformat组件处理后，文件以的形式进入我们自定义的mapper逻辑
复制链接

扫一扫

专栏目录

a920259310 CSDN认证博客专家 CSDN认证企业博客

码龄10年

9: 原创

61万+: 周排名

158万+: 总排名

2万+: 访问

: 等级

341: 积分

2: 粉丝

5: 获赞

4: 评论

4: 收藏

私信

关注

热门文章

分类专栏

最新评论

Redis动态删除主从节点
M-artin.online: 不知所云
kylin2.1.0+cdh5.10.1+安装部署+官方测试例子详细教程
just_data: 使用sample数据进行build cube的时候，到第三步出现error, 发现是kylin到hdfs上去找hive的jar包【 hive-metastore-2.0.0.jar 】了。。。但是配置的时候明明配的是本地路径。。是不是我哪里配置出问题？。。第一次报错的时候，我上传了jar包到相应路径，但是还是这个错，只是在不同路径下了。。。我在简书上看到一个说法是说hive的hadoop依赖问题，【https://www.jianshu.com/p/84b39b50b998 】，不过没有太明白。不知道楼主有没有遇到过？遇到过的话又是如何处理的呢？
kylin2.1.0+cdh5.10.1+安装部署+官方测试例子详细教程
zengrui_ops: 点击【System】之后，出现Oops:Failed to take action,请教是怎么回事？楼上的兄弟解决没？
kylin2.1.0+cdh5.10.1+安装部署+官方测试例子详细教程
诚恳: 点击【System】之后，出现Oops:Failed to take action,请教是怎么回事？

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。