Hadoop自带了一个历史服务器,可以通过历史服务器查看已经运行完的
Mapreduce作业记录,比如用了多少个Map、用了多少个Reduce、作业提交时间、
作业启动时间、作业完成时间等信息。默认情况下,Hadoop历史服务器是没有启
动的,我们可以通过下面的命令来启动Hadoop历史服务器
$> sbin/
开启jobhistory进程执行:mr-jobhistory-daemon.sh start historyserver
关闭jobhistory进程执行:mr-jobhistory-daemon.sh stop historyserver
配置历史服务器
为了查看程序的历史运行情况,需要配置一下历史服务器。具体配置步骤如下:
1、配置mapred-site.xml $HADOOP_HOME/etc/hadoop下的sbin里
启动历史服务器
$>mr-jobhistory-daemon.sh start historyserver
查看JobHistoryWebUI
http://master:19888
说明:该功能实际开发过程中需要打开。学习测试的时候不用打开,影响性能。
在Hadoop历史服务器的WEB UI上最多显示20000个历史的作业记录信息;
其实我们可以通过下面的参数进行配置,然后重启一下Hadoop jobhistory即可
注:历史记录最大数
mapreduce.jobhistory.joblist.cache.size
20000
hdfs-site.xml(每次修改后需要重启h