Spark History Server配置

最新推荐文章于 2024-04-27 16:09:31 发布

muyingmiao

最新推荐文章于 2024-04-27 16:09:31 发布

阅读量305

点赞数

分类专栏： Spark 文章标签： Spark History Server

本文链接：https://blog.csdn.net/muyingmiao/article/details/102525336

版权

Spark History Server允许用户在应用程序结束后查看运行详情。当Spark应用完成，它将运行信息写入指定目录，History Server加载这些信息以Web形式展示。配置包括在spark-defaults.conf中设定参数，创建HDFS上的日志目录，修改spark-env.sh，并启动History Server。验证成功后，可以通过Web界面查看历史作业日志。

摘要由CSDN通过智能技术生成

为什么要使用Spark History Server
在Spark安装成功后，无论是通过spark-submit工具还是通过Intellij IDEA提交任务，只要在Spark应用程序运行期间，都可以通过WebUI控制台页面来查看具体的运行细节，在浏览器中通过地址：http://<driver-node>:4040即可查看当前的运行状态。但是一旦应用程序运行结束，该Web界面也就失效了，无法继续查看监控集群信息。无法回顾刚刚运行的程序细节，进而定向做出优化，肯定极为不便。
这时候就需要为集群配置Spark History Server了。
注：<driver-node>可以是主机名，如master，也可以是主机名对应的IP。
Spark History Server可以很好地解决上面的问题。
通过配置，我们可以在Spark应用程序运行完成后，将应用程序的运行信息写入知道目录，而Spark History Server可以将这些信息装在并以Web形式供用户浏览。
要使用Spark History Server，对于提交应用程序的客户端需要配置以下参数。
配置步骤
1. 首先配置$SPARK_HOME$/conf目录下的spark-defaults.conf文件。
默认spark-defaults.conf是不存在的，我们可以根据Spark提供的template文件新建之。
并修改文件内容为：

spark.eventLog.enabled           true
spark.eventLog.dir               hdfs://hadoop000:8020/log/sparrk/spark_directory

最低0.47元/天解锁文章

muyingmiao

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录