Hadoop错误记录（一）：MapReduce过程虚拟内存溢出

最新推荐文章于 2021-11-03 17:43:16 发布

笨拙至极的GISer

最新推荐文章于 2021-11-03 17:43:16 发布

阅读量1.6k

点赞数 1

分类专栏：开发问题解决笔记文章标签： hadoop hdfs mapreduce

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/NNU_Giser/article/details/109176103

版权

在运行Hadoop HA集群上的MapReduce程序时遇到虚拟内存溢出错误，由于Task的数据量超过默认Container内存限制。解决方案包括：1) 降低每个Task的数据量，可通过调整HDFS Block大小实现；2) 扩大Container的虚拟内存容量，通过配置yarn-site.xml和mapred-site.xml调整内存比例。注意调整可能导致其他错误，需谨慎操作。

摘要由CSDN通过智能技术生成

使用4台Linux虚拟机搭建Hadoop HA集群后运行自行编写的轨迹数据处理程序时出现以下错误（原始文件1.3GB），该程序在本机Java环境下可正常运行。控制台提示错误如下，显然每个Task需要使用的虚拟内存值超过了yarn默认Container的最大内存值，导致container被Kill，程序运行中断。

解决方案：

思路一：在Container容量不变的情况下，降低每个Task的数据量，使之不再溢出

Task的数据量必须大于HDFS中数据块的大小，Hadoop 3.x.x版本默认每个Block块的大小为128MB，若需要降低Block的大小，需在hdfs-site.xml配置文件中添加以下内容，其中xxx是每个块的字节数，例如128MB对应的数值为1024*1024*128=134217728，修改至合适的数值后重启HA集群。

<property>
  <name>dfs.blocksize</name>
  <value>xxx</value>
</property>

思路二：扩大Container虚拟内存的容量，使之不再溢出

具体设置原理可参阅https://blog.csdn.net/u010226454/article/details/80907088࿱

最低0.47元/天解锁文章

笨拙至极的GISer

关注

1
点赞
踩
8

收藏

觉得还不错? 一键收藏
2
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。