YARN和MapReduce的内存设置参考

最新推荐文章于 2024-06-28 10:18:31 发布

代立冬

最新推荐文章于 2024-06-28 10:18:31 发布

阅读量8.9k

点赞数 4

分类专栏： ● Hadoop --------【Hadoop】

本文链接：https://blog.csdn.net/odailidong/article/details/50951138

版权

本文介绍了如何为YARN和MapReduce设置内存参数，包括使用HDP配置工具脚本和手动计算方法。建议根据集群硬件资源，如CPU、内存和磁盘，以及系统预留内存来确定容器数量和大小。还提到了NameNode的堆大小设置，并指出在YARN上运行MapReduce时不再设置静态的Map和Reduce任务。

摘要由CSDN通过智能技术生成

如何确定Yarn中容器Container，Mapreduce相关参数的内存设置，对于初始集群，由于不知道集群的类型(如cpu密集、内存密集)我们需要根据经验提供给我们一个参考配置值，来作为基础的配置。

完成这一任务有两种方式，确定YARN和MapReduce的内存设置，我们可以使用HDP工具脚本进行内存配置设定

运行hdp-configuration-utils.py 这个Python脚本(下载地址：hdp-configuration-utils）来计算YARN、MapReduce需要的内存，执行以下命令

python hdp-configuration-utils.py options

其中可选项如下：

选项	描述
-c CORES	每一个客户机的核数目
-m MEMORY	每一个客户机拥有的内存总数
-d DISK	每一个客户机拥有的磁盘数目
-k HBASE	如果Hbase安装了为”True”，否则为”False”