hadoop mapper和reduce数量设置

最新推荐文章于 2023-03-02 21:53:33 发布

cao447214075

最新推荐文章于 2023-03-02 21:53:33 发布

阅读量662

点赞数

分类专栏： hadoop 文章标签：大数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/cao447214075/article/details/84684473

版权

hadoop 专栏收录该内容

4 篇文章 0 订阅

订阅专栏

但是通过这种方式设置map的个数，并不是每次都有效的。原因是mapred.map.tasks只是一个hadoop的参考数值，最终map的个数，还取决于其他的因素。
为了方便介绍，先来看几个名词：
block_size : hdfs的文件块大小，默认为64M，可以通过参数dfs.block.size设置
total_size : 输入文件整体的大小
input_file_num : 输入文件的个数
（1）默认map个数
如果不进行任何设置，默认的map个数是和blcok_size相关的。
default_num = total_size / block_size;
（2）期望大小
可以通过参数
mapred.map.tasks来设置程序员期望的map个数，但是这个个数只有在大于default_num的时候，才会生效。
goal_num =mapred.map.tasks;
（3）设置处理的文件大小
可以通过mapred.min.split.size 设置每个task处理的文件大小，但是这个大小只有在大于
block_size的时候才会生效。
split_size = max(
mapred.min.split.size,
block_size);split_num = total_size / split_size;
（4）计算的map个数
compute_map_num = min(split_num, max(default_num, goal_num))
除了这些配置以外，mapreduce还要遵循一些原则。 mapreduce的每一个map处理的数据是不能跨越文件的，也就是说max_map_num <= input_file_num。所以，最终的map个数应该为：
final_map_num = min(compute_map_num, input_file_num)
经过以上的分析，在设置map个数的时候，可以简单的总结为以下几点：
（1）如果想增加map个数，则设置mapred.map.tasks 为一个较大的值。
（2）如果想减小map个数，则设置mapred.min.split.size 为一个较大的值。

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

cao447214075 CSDN认证博客专家 CSDN认证企业博客

码龄16年

81: 原创

29万+: 周排名

166万+: 总排名

2万+: 访问

: 等级

220: 积分

1: 粉丝

2: 获赞

2: 评论

11: 收藏

私信

关注

热门文章

分类专栏

搜索 1篇
分布式 1篇
msyql 1篇
flex 9篇
工作 2篇
js 9篇
java 18篇
电脑技术常识 1篇
数据库 4篇
IT行业 1篇
spring 4篇
MVC 1篇
struts 5篇
linux 3篇
web 3篇
portal 1篇
软件 2篇
hadoop 4篇
spring boot 1篇

最新评论

elasticsearch单机版安装
CSDN-Ada助手: 非常感谢CSDN博主分享的"elasticsearch单机版安装"文章，对于想要学习elasticsearch的用户来说非常有用。我觉得下一篇博客可以写关于elasticsearch的索引优化和查询优化，让读者更深入地了解这个强大的搜索引擎，帮助他们更好地应用到实际项目中。相信这样的技术文章对其他用户也会有很大的帮助。期待您的下一篇博客，一定会有更多读者关注和学习！为了方便博主创作，提高生产力，CSDN上线了AI写作助手功能，就在创作编辑器右侧哦～（https://mp.csdn.net/edit?utm_source=blog_comment_recall ）诚邀您来加入测评，到此（https://activity.csdn.net/creatActivity?id=10450&utm_source=blog_comment_recall）发布测评文章即可获得「话题勋章」，同时还有机会拿定制奖牌。
spring boot 使用gradle打包包含所有依赖jar包
武壮: Task :im-cloud:webim:findMainClass FAILED FAILURE: Build failed with an exception. * What went wrong: Execution failed for task ':im-cloud:webim:findMainClass'. > org.gradle.api.tasks.SourceSetOutput.getClassesDir()Ljava/io/File;[code=plain] Task :im-cloud:webim:findMainClass FAILED FAILURE: Build failed with an exception. * What went wrong: Execution failed for task ':im-cloud:webim:findMainClass'. > org.gradle.api.tasks.SourceSetOutput.getClassesDir()Ljava/io/File; [/code]

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。