关于spark-yarn中spark-env.sh和yarn-site的文件配置

00不是程序员

已于 2024-04-15 15:12:04 修改

阅读量306

点赞数 1

文章标签： spark

于 2024-04-15 14:58:29 首次发布

本文链接：https://blog.csdn.net/qq_64134918/article/details/137781042

版权

本文详细介绍了如何配置HadoopYARN在Spark环境下的设置，包括yarn-site.xml中各参数的含义和修改，以及如何同步配置到集群其他节点和在spark-yarn的conf文件中添加JAVA_HOME和YARN_CONF_DIR的步骤。

摘要由CSDN通过智能技术生成

今天上课学了spark-yarn的配置

主要其实是配置hadoop/etc/hadoop/yarn-site文件的内容：

/export/servers/hadoop/etc/hadoop/yarn-site.xml

<configuration>

<!-- Site specific YARN configuration properties -->
        <property>
                <name>yarn.resourcemanager.hostname</name>
                <value>hadoop001</value>
        </property>

        <property>
                <name>yarn.nodemanager.aux-services</name>
                <value>mapreduce_shuffle</value>
        </property>
        <property>
                <name>yarn.nodemanager.pmem-check-enabled</name>
                <value>false</value>
        </property>
        <property>
                <name>yarn.nodemanager.vmem-check-enabled</name>
                <value>false</value>
        </property>
        <property>
            <name>yarn.nodemanager.vmem-pmem-ratio</name>
            <value>10</value>
        </property>

</configuration>

要注意的是，前面一个hadoop1需要改成自己的主机名，通常是在集群的第一个机器安装，yarn-site配置好后

xsync到另外两台机器，如果没有xsync脚本文件，详情参考编写集群分发脚本xsync_xsync集群分发脚本-CSDN博客

这个分发脚本特别好用，强推

最后就是到spark-yarn中的conf文件里更改spark.env-sh

原文件名字叫spark-env.sh.template，我们需要删除后缀

执行

mv spark-env.sh.template spark-env.sh

然后vi到文件，添加 JAVA_HOME 和 YARN_CONF_DIR 配置

export JAVA_HOME=/opt/module/jdk1.8.0_144
YARN_CONF_DIR=/opt/module/hadoop/etc/hadoop

配置完成后需要重启yarn和hdfs才可以正常使用

00不是程序员

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
3
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫