spark on yarn 配置

B_Data

已于 2023-03-15 08:36:32 修改

阅读量659

点赞数

分类专栏：笔记文章标签： spark yarn scala

于 2021-12-20 15:38:13 首次发布

本文链接：https://blog.csdn.net/weixin_51683372/article/details/122042269

版权

笔记专栏收录该内容

15 篇文章 1 订阅

订阅专栏

spark on yarn 配置

解压安装

解压安装

1.1解压Scala

tar -zxvf scala-2.11.8.tgz -C /usr/project/

1.2解压Spark

tar -zxvf spark-2.4.4-bin-hadoop2.7.tgz -C /usr/project/

1.3配置环境变量

vi /etc/profile

注意：在写环境变量前已经将Scala和Spark的名字重命名（因为名字太长太复杂 [/狗头]）

#scala
export SCALA_HOME=/usr/project/scala
export PATH=$PATH:$SCALA_HOME/bin
#spark
export SPARK_HOME=/usr/project/spark
export PATH=$PATH:$SPARK_HOME/bin

重新加载环境变量

注意：下面两个命令意思相同可自行选择
. /etc/profile
source /etc/profile

1.4配置Spark

1.4.1重命名

进入conf下

在这里插入图片描述

/usr/project/spark/conf

在这里插入图片描述

mv spark-env.sh.template spark-env.sh
mv slaves.template slaves

在这里插入图片描述

1.4.2配置spark-env.sh

在最底部添加！

export HADOOP_CONF_DIR=/opt/hadoop-2.7.7/etc/hadoop
export YARN_CONF_DIR=/opt/hadoop-2.7.7/etc/hadoop

1.4.3向yarn-site.xml添加配置

cd 进入:/usr/project/hadoop-2.7.7/etc/hadoop
vi yarn-site.xml
注意*是内部添加

<property>
        <name>yarn.nodemanager.pmem-check-enabled</name>
        <value>false</value>
</property>
<property>
        <name>yarn.nodemanager.vmem-check-enabled</name>
        <value>false</value>
</property>
<property>
        <name>yarn.nodemanager.vmem-pmem-ratio</name>
        <value>4</value>
</property>

上方添加配置内容介绍

1.5启动Hadoop

start-all.sh
或者
start-dfs.sh、start-yarn.sh

使用spark运行在yarn上

spark-shell --master yarn --deploy-mode client

在这里插入图片描述

1.5.1查看yarn web

ip:8088

在这里插入图片描述
成功！！！！

B_Data

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
spark on yarn 配置

spark on yarn 配置解压安装1.1解压Scala1.2解压Spark1.3配置环境变量1.4配置Spark1.4.1重命名1.4.2配置spark-env.sh1.4.3向yarn-site.xml添加配置1.5启动Hadoop1.5.1查看yarn web解压安装1.1解压Scalatar -zxvf scala-2.11.8.tgz -C /usr/project/1.2解压Sparktar -zxvf spark-2.4.4-bin-hadoop2.7.tgz -C /us
复制链接

扫一扫