1. 问题背景
生产环境导入大量的数据进行计算,出现以下报错:
'PHYSICAL' memory limit. Current usage: 1.0 GB of 1 GB physical memory used; 3.0 GB of 2.1 GB virtual memory used. Killing container
客户端通过hadoop-client调用,hadoop服务版本为3.x,尝试在客户端增加-Xmx参数并不生效。
2. 解决方法
分析问题, 原因应该是超出服务端所设定的内存限制, 被强制结束, 所以修改客户端的运行参数并不能真正生效。 但服务端所涉及的内存参数调整比较多, 分别是控制Yarn、Mapper和Reducer的内存, 如果想真正解决内存限制问题,简单的方法是全部调整扩大:
- 修改hadoop下的mapred-site.xml配置文件:
<!--将yarn、mapper和reducer的JAVA运行运行时内存调整为16G -->
<property>
<name>yarn.app.mapreduce.am.command-opts</name>
<value>-Djava.net.preferIPv4Stack=true -Xmx17179869184</value>
</property>
<property>
<name>mapreduce.map.java.opts</name>
<value>-Djava.net.preferIPv4Stack=true -Xmx17179869184</value>
</property>
<property>
<name>mapreduce.reduce.java.opts</name>
<value>-Djava.net.preferIPv4Stack=true -Xmx17179869184</value>
</property>
<!--将yarn、mapper和reducer的内存上限调整为16G -->
<property>
<name>yarn.app.mapreduce.am.resource.mb</name>
<value>16384</value>
</property>
<property>
<name>mapreduce.map.memory.mb</name>
<value>16384</value>
</property>
<property>
<name>mapreduce.reduce.memory.mb</name>
<value>16384</value>
</property>
<property>
<name>yarn.app.mapreduce.am.resource.mb</name>
<value>16384</value>
</property>
- 将所有hadoop节点的配置做以上调整修改, 然后重启hadoop服务生效。