【Spark】Spark On Yarn 安装

最新推荐文章于 2024-03-15 01:45:00 发布

勤言不勤语

最新推荐文章于 2024-03-15 01:45:00 发布

阅读量864

点赞数

分类专栏： Spark 文章标签： spark

本文链接：https://blog.csdn.net/w1992wishes/article/details/103067027

版权

文章目录

一、下载和解压

https://archive.apache.org/dist/spark/spark-2.3.1/

tar zxv -f spark-2.3.1-bin-hadoop2.7.tgz
mv spark-2.3.1-bin-hadoop2.7/ spark-2.3.1

二、配置

2.1、配置 spark-default.conf，按需调整

spark.eventLog.enabled             true
spark.eventLog.dir                 hdfs://myha01/user/spark/eventLogs
spark.eventLog.compress            true
spark.history.fs.logDirectory      hdfs://myha01/user/spark/eventLogs
spark.yarn.historyServer.address   ds075:18080

spark.serializer                 org.apache.spark.serializer.KryoSerializer

spark.master                    yarn 
spark.driver.cores              2
spark.driver.memory             5g 
spark.executor.cores            2
spark.executor.memory           4g
spark.executor.instances        4

spark.sql.warehouse.dir         hdfs://myha01/user/hive/warehouse

# 用来存放spark的依赖jar包
spark.yarn.jars=hdfs://myha01/user/spark/spark_jars/*

spark.eventLog.enabled：设置true开启日志记录.
spark.eventLog.dir：存储日志路径，Application 在运行过程中所有的信息均记录在该属性指定的路径下,我这里设置的是 hdfs 路径(也可以是本地路径如file:///val/log/sparkEventLog)
spark.yarn.historyServer.address：设置 History Server 的地址和端口，这个链接将会链接到 YARN 检测界面上的 Tracking UI
spark.history.fs.logDirectory：日志目录和 spark.eventLog.dir 保持一致，Spark History Server 页面只展示该指定路径下的信息
spark.eventLog.compress：是否压缩记录Spark事件信息，前提spark.eventLog.enabled 为 true，默认使用的是snappy

2.2、配置 spark-env.sh

export JAVA_HOME=/usr/local/jdk1.8.0_231
export HADOOP_HOME=/home/hadoop/hadoop-2.9.2
export HADOOP_CONF_DIR=${HADOOP_HOME}/etc/hadoop
export SPARK_MASTER_IP=ds072

# spark 日志保存时间
export SPARK_HISTORY_OPTS="-Dspark.history.retainedApplications=10"

2.3、配置 slaves

cp slaves.template slaves
vim slaves

在文件末尾直接添加配置内容即可，配置示例如下：

2.4、创建目录

hdfs dfs -mkdir -p /user/spark/jobs/history
hdfs dfs -mkdir -p /user/spark/spark_jars
hdfs dfs -mkdir -p /user/spark/eventLogs

spark-defaults.conf 中配置的目录，用来存放 spark 的依赖jar包，需要进入 Spark 的 jars 目录，执行如下命令上传 jar 包：

hdfs dfs -put ./* /user/spark/spark_jars

2.5、拷贝到其他节点

scp -r spark-2.3.1 ds073:/home/hadoop
scp -r spark-2.3.1 ds074:/home/hadoop
scp -r spark-2.3.1 ds075:/home/hadoop

2.6、配置环境变量

vim ~/.bashrc 

# spark
export SPARK_HOME

最低0.47元/天解锁文章

勤言不勤语

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
【Spark】Spark On Yarn 安装

文章目录一、下载和解压二、配置2.1、配置 spark-default.conf，按需调整2.2、配置 spark-env.sh2.3、配置 slaves2.4、创建目录2.5、拷贝到其他节点2.6、配置环境变量三、启动与测试3.1、启动 Standalone 模式3.2、启动 spark 的 history-server3.3、测试 Yarn 模式一、下载和解压https://archiv...
复制链接

扫一扫

专栏目录