使用spark在yarn上运行

最新推荐文章于 2024-05-22 00:24:23 发布

冯小瑞

最新推荐文章于 2024-05-22 00:24:23 发布

阅读量363

点赞数

本文链接：https://blog.csdn.net/Romantic_sir/article/details/103050571

版权

①使用Yarn运行spark时,需要在spark-env.sh中添加以下行

export HADOOP_CONF_DIR=$HADOOP_HOME/etc/hadoop

注意：在您的环境中检查$HADOOP_HOME / etc / hadoop是否正确.而spark-env.sh也包含HADOOP_HOME的导出.

②修改/root/apps/hadoop-2.8.1/etc/hadoop/yarn-site.xml，在原有基础上添加两个配置

<property>
		<name>yarn.nodemanager.vmem-check-enabled</name>
		<value>false</value>
		<description>Whether virtual memory limits will be enforced for containers</description>
</property>
<property>
		<name>yarn.nodemanager.vmem-pmem-ratio</name>
		<value>4</value>
		<description>Ratio between virtual memory to physical memory when setting memory limits for containers</description>
</property>

③启动

[root@hdp-1 bin]# ./spark-shell --master yarn --deploy-mode client

这样就可以在交互页面进行操作

然后再打开YARN WEB页面：http://hdp-1:8088，可以看到Spark shell应用程序正在运行

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

冯小瑞

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
使用spark在yarn上运行

①使用Yarn运行spark时,需要在spark-env.sh中添加以下行export HADOOP_CONF_DIR=$HADOOP_HOME/etc/hadoop注意：在您的环境中检查$HADOOP_HOME / etc / hadoop是否正确.而spark-env.sh也包含HADOOP_HOME的导出.②修改/root/apps/hadoop-2.8.1/etc/hadoo...
复制链接

扫一扫