Spark从入门到精通第九课:Spark监控之history-server

1、每一个SparkContext都会启动一个网页UI,这个网的UI上包含诸如stages/tasks/RDD/executor/配置环境/配置参数等一些许许多多的信息,它默认的地址是http://<driver_node>:4040,当我们在一个机器上运行了多个SparkContext的时候,除了第一个SparkContext,其余的SparkContext的默认端口就变为4041、4042。。。。

2、但是呢,当我们任务完成或者任务异常终止之后,这个网页的UI就不可用了,如何在任务结束后仍然能看到我们的任务等相关信息呢,有两种方式:

A.在任务启动前将spark.eventLog.enabled属性设置为true,或在启动任务时将park.eventLog.enabled的值true传入。

B.这时候就轮到我们的history-server粉墨登场啦。

 

3、启用history-server的前置配置:

vi spark-defaults.conf 添加

spark.eventLog.enabled  true

spark.eventLog.dir  hdfs://hadoop001:9000/spark-logs

####hdfs上的这个“/spark-logs”目录要创建哦

vi spark-env.sh,添加

SPARK_HISTORY_OPTS="-Dspark.history.fs.logDirectory=hdfs://hadoop001:9000/spark-logs"

###关于OPTS的东西都要以-D形式表示哦

 

spark-env.sh 参数格式 SPARK_XXX_XXX=.........

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

二百四十九先森

你的打赏是我努力的最大动力~

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值