MapReduce可调整参数解释

最新推荐文章于 2024-08-27 15:06:45 发布

小朋友2D

最新推荐文章于 2024-08-27 15:06:45 发布

阅读量292

点赞数

分类专栏： Hadoop

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ct2020129/article/details/81699758

版权

Hadoop 专栏收录该内容

12 篇文章 0 订阅

订阅专栏

文章取自《Hadoop技术内幕：深入解析MapReduce架构设计与实现原理》

Map Task可调整参数

参数名称	参数含义	默认值
io.sort.mb	Map Task缓冲区所占内存大小	100MB
io.sort.record.percent	缓冲kvoffsets和kvindices共占io.sort.mb的内存比例	0.05
io.sort.spill.percent	缓冲区kvoffsets或者kvoffsets内存使用率达到该比例后，会触发溢写操作，将内存中的数据写成一个文件	0.80
mapred.compress.map.output	是否压缩Map Task中间结果	true
mapred.map.output.compression.codec	如果支持压缩Map Task中间结果，则采用什么压缩器	org.apache.hadoop.io.compress.zlib

Reduce Task可调整参数

参数名称	参数含义	默认值
mapred.reduce.parallel.copies	Reduce Task同时启动的数据拷贝线程数目	5
mapred.job.reduce.input.buffer.percent	Hadoop假设用户的reduce()函数需要所有的JVM内存，因此执行reduce()函数前要释放所有内存。如果设置了该值，可将部分文件保存在内存中（不必写到磁盘上）	0
mapred.job.shuffle.input.buffer.percent	ShuffleRamManager管理的内存占JVM Heap Max Size的比例	0.70
mapred.job.shuffle.merge.percent	当内存使用率超过该值后，会触发一次合并，将内存中的数据写到磁盘上	0.66
mapred.inmem.merge.threshold	当内存中的文件数量超过该阈值时，会触发一次合并，将内存中的数据写到磁盘上	1000
io.sort.factor	文件合并时，一次合并的文件数目（合并后，将合并后的文件放到磁盘上继续合并，注意，每次合并时，选择最小的前io.sort.factor进行合并）	10或100
tasktracker.http.threads	HTTP Server上的线程数。该Server运行在每个Task Tracker上，用于处理Map Task输出	40

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。