（8）Spark 2.0.0 查看job 历史日志

最新推荐文章于 2024-06-26 11:02:49 发布

GISer.Wang

最新推荐文章于 2024-06-26 11:02:49 发布

阅读量4.7k

点赞数 1

分类专栏：大数据框架应用学习文章标签： spark

本文链接：https://blog.csdn.net/LoveCarpenter/article/details/78793015

版权

大数据框架应用学习专栏收录该内容

14 篇文章 1 订阅

订阅专栏

引言
启动Spark历史日志

1.引言

在使用Spark的时候，有时候我们会关注job的历史日志，但是在Spark中默认情况下，历史日志是关闭的，在本篇博客中主要介绍一下如何启动spark的历史日志。

博主的环境为：

操作系统为Centos6.7
Hadoop版本为2.6.1
Hadoop安装目录为：/usr/local/hadoop
HDFS的地址为：hdfs://localhost:9000
Spark的版本为：2.0.0，且Spark是伪分布安装。

2. 启动Spark历史日志

2.1 安装Spark

如何安装Spark的伪分布，请参考博文：Spark 2.0.0 伪分布安装

2.2 修改配置文件`spark-defaults.conf`

//将模板文件修改为配置文件
cp spark-defaults.conf.template spark-defaults.conf
//修改的配置信息
spark.eventLog.enabled true 
//设置hdfs的目录，需要和自己hadoop的目录匹配
spark.eventLog.dir hdfs://localhost:9000/var/log/spark 
spark.eventLog.compress true

这里写图片描述

2.3 修改配置文件spark-env.sh

//配置文件最后加入
export SPARK_HISTORY_OPTS="-Dspark.history.ui.port=18080 -Dspark.history.retainedApplications=3 -Dspark.history.fs.logDirectory=hdfs:/localhost:9000/var/log/spark"

这里写图片描述

2.4 创建日志目录

Spark不会自动创建日志文件夹，因此需要我们自己创建

//首先进入hadoop的bin目录
cd /usr/local/hadoop/bin
//创建文件夹命令
./hadoop fs -mkdir /var
./hadoop fs -mkdir /var/log
./hadoop fs -mkdir /var/log/spark

2.5 启动spark历史日志web端

//进入spark的bin目录
cd /usr/local/spark/sbin
//如果spark集群正在启动，首先停止集群
./stop-all.sh
//重新启动集群
./start-all.sh
//启动job历史端口
./start-history-server.sh

2.6 浏览器查看是否启动成功

浏览器输入：http://localhost:18080查看（在linux机器上查看）

这里写图片描述

GISer.Wang

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
（8）Spark 2.0.0 查看job 历史日志

引言启动Spark历史日志1 安装Spark2 修改配置文件spark-defaultsconf3 修改配置文件spark-envsh4 创建日志目录5 启动spark历史日志web端6 浏览器查看是否启动成功1.引言在使用Spark的时候，有时候我们会关注job的历史日志，但是在Spark中默认情况下，历史日志是关闭的，在本篇博客中主要介绍一下如何启动spark的历史日志
复制链接

扫一扫