Spark History Server 配置方法

本文介绍了Spark History Server的配置目的,基本原理,启动步骤,客户端配置以及如何查看历史作业记录。通过History Server,可以方便地分析和解决Spark作业执行中的问题。
摘要由CSDN通过智能技术生成

一、配置目的
我们在spark上运行程序的时候会经历很多次任务失败,而任务结束后,我们无从得知问题处在哪里,Spark提供了History Server服务可以保存历史Application的运行记录,帮助我们更好的解决问题。

官方文档参考:https://spark.apache.org/docs/latest/configuration.html

二、基本原理
Spark作业将作业执行的记录写到hdfs上,然后history server从对应的路径上读取作业的运行记录,解析之后展示到页面上。

三、启动History
1.准备一个spark-client
2.基本配置
两种配置方式,spark-defaults.conf中直接添加配置项和在spark-env.sh中配置环境变量SPARK_HISTORY_OPTS二选一
比如,在spark-default.conf 直接添加配置项:

spark.history.ui.port 8642
spark.history.fs.logDirectory hdf
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值