hdfs-mapreduce处理流程（二）

最新推荐文章于 2021-12-24 20:37:07 发布

Java架构师联盟

最新推荐文章于 2021-12-24 20:37:07 发布

阅读量370

点赞数

分类专栏： mapreduce 处理流程大数据文章标签： java mapreduce hadoop 大数据

git地址：https://github.com/biws-byte/mxq

本文链接：https://blog.csdn.net/weixin_42864905/article/details/104507296

版权

在这里插入图片描述
1、问题：在这张图中有几个工人,几个工厂
工人: 4 --map处理程序
厂: 3 --reduce相当于最后的工厂组装

2、map端进行了什么事:砍树这一步叫做split 过程
砍树—把我们hdfs的文件进行切割(砍树) ----- 默认与block块的大小一
致(128M) split=block=maptask
2.1当然为了更好的处理，在计算资源充足的情况下，把split变大设置为256M

split= 2block= maptask

2、计算资源不充足，假设一个maptask只能处理64M的数据，那该怎么办呢？
有一个词叫做并行计算，并且中国传统文化也支持有福同享，有难同当，对吧
那我们就把split设置为64M

2split= 1 block= 2maptask

那在这里也证明了一个点
-一个计算处理进程(maptask)处理一个split

1split= 1maptask

最低0.47元/天解锁文章

Java架构师联盟

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
hdfs-mapreduce处理流程（二）

1、问题：在这张图中有几个工人,几个工厂工人: 4 --map处理程序厂: 3 --reduce相当于最后的工厂组装2、map端进行了什么事:砍树这一步叫做split 过程砍树—把我们hdfs的文件进行切割(砍树) ----- 默认与block块的大小一致(128M) split=block=maptask2.1当然为了更好的处理，在计算资源充足的情况下，把split变大设置为25...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。