Hadoop MapReduce ShuffleError: error in shuffle

最新推荐文章于 2022-03-09 11:30:04 发布

sunrising_hill

最新推荐文章于 2022-03-09 11:30:04 发布

阅读量745

点赞数

分类专栏： Hadoop 文章标签： Hadoop ShuffleError HADOOP_HEAPSIZE hadoop-env.sh

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/sunrising_hill/article/details/50535814

版权

Hadoop 专栏收录该内容

14 篇文章 0 订阅

订阅专栏

参数：mapreduce.reduce.shuffle.input.buffer.percent

默认值：0.70

含义：The percentage of memory to be allocated from the maximum heap size to storing map outputs during the shuffle.

参数：mapreduce.reduce.shuffle.parallelcopies

默认值：5

含义：The default number of parallel transfers run by reduce during the copy(shuffle) phase.

上面两个参数表示了hadoop从map向reduce传输数据shuffle的时候所用的内存buffer限制，第一个参数

表示每个shuffle进程占用的memery比例。第二个参数表示最多有几个进程，两个参数的乘积不能最好

不要大于1，不然当同时有5个shuffle时，会占用太多内存，导致报异常。注意这里说的内存值得是java

指定的-Xmx的最大堆内存。

如果修改完上面两个参数还是报错的话，需要进行如下修改：

Hadoop伪分布式模式运行时，运行一个Job报上面错误，原因是由于Hadoop的最大对内存过小，

hadoop默认分配的最大堆内存大小为1000MB，有时候跑的job所需的内存可能比这个数值要大

很多，这是修改运行是的最大大小并不是mapreduce.map.java.opts或者mapreduce.reduce.java.opts

参数的值，他们是在分布式环境下的配置参数。

此时我们需要修改的代码位于hadoop-env.sh文件中（该文件位于HADOOP_HOME_DIR/etc/hadoop

目录下），在该文件中搜索“HADOOP_HEAPSIZE”参数，直接将该行的注释去掉，末尾增加你

需要设置的内存大小，单位默认为MB，比如你想设置最大对内存为4GB，你需要填写4096，

修改完成该行的内容为：

export HADOOP_HEAPSIZE=4096

修改完之后，重启hadoop服务，所有的-Xmx=1000都变为了-Xmx=4096：

4271 ?        Sl     0:14 /usr/local/jdk/bin/java -Dproc_namenode -Xmx4096m -Djava.net.preferIPv4Stack=true -Dhadoop.log.dir=/usr/local/hadoop/logs -
4431 ?        Sl     0:11 /usr/local/jdk/bin/java -Dproc_datanode -Xmx4096m -Djava.net.preferIPv4Stack=true -Dhadoop.log.dir=/usr/local/hadoop/logs -
4660 ?        Sl     0:12 /usr/local/jdk/bin/java -Dproc_secondarynamenode -Xmx4096m -Djava.net.preferIPv4St

这是再启动job，所使用的-Xmx参数也变为了：4096m

/usr/local/jdk/bin/java -Xmx4096m -Djava.net.preferIPv4Stack=true -Dhadoop.log.dir

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Hadoop MapReduce ShuffleError: error in shuffle

Hadoop伪分布式模式运行时，运行一个Job报上面错误，原因是由于Hadoop的最大对内存过小，hadoop默认分配的最大堆内存大小为1000MB，有时候跑的job所需的内存可能比这个数值要大很多，这是修改运行是的最大大小并不是mapreduce.map.java.opts或者mapreduce.reduce.java.opts参数的值，他们是在分布式环境下的配置参数。此时我们需
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。