hadoop:配置历史服务器JobHistory和日志聚集

一、历史服务器JobHistory

为了查看程序的历史运行情况,需要配置一下历史服务器。在重启hadoop后All Applications 也就是我们之前配置的hadoop103:8088端口是无法查看历史信息的

1)配置mapred-site.xml

hadoop@hadoop102:/home/opt/module/hadoop/etc/hadoop$ vim mapred-site.xml 

在该文件里面增加如下配置。

<!-- 历史服务器端地址 -->
<property>
    <name>mapreduce.jobhistory.address</name>
    <value>hadoop102:10020</value>
</property>

<!-- 历史服务器web端地址 -->
<property>
    <name>mapreduce.jobhistory.webapp.address</name>
    <value>hadoop102:19888</value>
</property>

2)分发配置

hadoop@hadoop102:/home/opt/module/hadoop/etc/hadoop$ xsync mapred-site.xml

配置好后通过我们写的插件jpsall即可查看历史服务器是否启动

配置前

配置启动后

3)在hadoop102启动历史服务器

hadoop@hadoop102:/home/opt/module/hadoop/etc/hadoop$ mapred --daemon start historyserver

4)查看历史服务器是否启动

hadoop@hadoop102:/home/opt/module/hadoop/etc/hadoop$ jpsall

5)查看JobHistory

 刚开始配置好jobhistory,web端是没有东西的我这里先运行了一个任务实验了一下

http://hadoop102:19888/jobhistoryy​​​​​​http://hadoop102:19888/jobhistory


二、日志聚集

日志聚集概念:应用运行完成以后,将程序运行日志信息上传到HDFS系统上。日志聚集功能好处:可以方便的查看到程序运行详情,方便开发调试。

 

1)配置yarn-site.xml

(1)在yarn-site.xml中加入以下内容

hadoop@hadoop102:/home/opt/module/hadoop/etc/hadoop$ vim yarn-site.xml  

<!-- 开启日志聚集功能 -->
<property>
    <name>yarn.log-aggregation-enable</name>
    <value>true</value>
</property>
<!-- 设置日志聚集服务器地址 -->
<property>  
    <name>yarn.log.server.url</name>  
    <value>http://hadoop102:19888/jobhistory/logs</value>
</property>
<!-- 设置日志保留时间为7天 -->
<property>
    <name>yarn.log-aggregation.retain-seconds</name>
    <value>604800</value>
</property>

(2)分发配置:给其他虚拟机配置,使用我们自己写的基于rsync的shell插件

hadoop@hadoop102:/home/opt/module/hadoop/etc/hadoop$ xsync yarn-site.xml

 注意:开启日志聚集功能,需要重新启动NodeManager ResourceManagerHistoryServer

(3)使用myhadoop.sh 脚本重新启动hadoop并重启历史服务器

hadoop@hadoop102:/home/opt/module/hadoop/etc/hadoop$ myhadoop.sh stop
hadoop@hadoop102:/home/opt/module/hadoop/etc/hadoop$mapred --daemon stop historyserver

======启动 hadoop集群 =======
hadoop@hadoop102:/home/opt/module/hadoop/etc/hadoop$ myhadoop.sh start
hadoop@hadoop102:/home/opt/module/hadoop/etc/hadoop$ mapred --daemon start historyserver
 

2)先在ubuntu运行一次wordcount任务,使你的历史服务器里面有历史任务

/output2:输出,因为第一次处理时生成了output文件夹,不能重复使用

hadoop@hadoop102:/home/opt/module/hadoop$ hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-3.1.3.jar wordcount /input /output2

3)在浏览器进入JobHistory, 点击任务job ID进入job界面

点击log:因为在配置yarn-site.xml时把日志配置到log里面因此点击log即可看到文件日志

  • 3
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

北方569

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值