Spark on yran配置以及开启历史记录服务

环境介绍

  1. jdk 1.8
  2. Scala 2.11.12
  3. Spark 2.4.5

1. spark-env.sh文件
需要根据实际情况修改,在原来模板上只需要追加此行,不需要设置master等等,因为提交yran执行只需要一台机器有spark即可。

# 指定yran的配置文件目录
export YARN_CONF_DIR=/home/hadoop/apps/hadoop-2.7.7/etc/hadoop

2. spark-defaults.conf
/spark/logs目录要预先创建

spark.yarn.historyServer.address bd01:18080
spark.history.ui.port            18080
spark.history.fs.logDirectory    hdfs://mycluster/spark/logs
spark.eventLog.enabled           true
spark.eventLog.dir               hdfs://mycluster/spark/logs
spark.eventLog.compress          true

3. yarn-site.xml
建议添加两项配置

<!--是否启动一个线程检查每个任务正使用的物理内存量,如果任务超出分配值,则直接将其杀掉,默认是true -->
 <property>
   <name>yarn.nodemanager.pmem-check-enabled</name>
   <value>false</value>
 </property>

<!--是否启动一个线程检查每个任务正使用的虚拟内存量,如果任务超出分配值,则直接将其杀掉,默认是true -->
 <property>
   <name>yarn.nodemanager.vmem-check-enabled</name>
   <value>false</value>
 </property>

测试

  • 重启Spark历史服务
sbin/sbin/stop-history-server.sh
sbin/sbin/stop-history-server.sh
  • 执行示例程序
 # client 方式
bin/spark-submit \
--class org.apache.spark.examples.SparkPi \
--master yarn \
--deploy-mode client \
./examples/jars/spark-examples_2.11-2.4.5.jar \
100

 # cluster 方式
bin/spark-submit \
--class org.apache.spark.examples.SparkPi \
--master yarn \
--deploy-mode cluster \
./examples/jars/spark-examples_2.11-2.4.5.jar \
100

yran查看历史记录
查看执行过程

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值