Hadoop(2):MR日志聚合以及服务开启

25 篇文章 1 订阅
7 篇文章 0 订阅

一、日志服务:

1、历史服务器作用:

        查看已经运行完成的应用记录。需要指定historyserver的地址,内部和外部通信端口号,如果不指定默认是本机。historyserver是一个轻量级的服务,可以部署在任意一台节点上。必须开启日志服务才可以看聚合(保存)下来的日志。
2、配置(在mapred-site.xml中):
    注意:这里的端口号不能随便修改

<property>
  <name>mapreduce.jobhistory.address</name>
  <value>hadoop01:10020</value>
</property>
<property>
  <name>mapreduce.jobhistory.webapp.address</name>
  <value>hadoop01:19888</value>	  
</property>

二、日志聚合

1、功能作用

开启聚合功能,可以将mapreduce任务日志保存,方便history服务器进行查询。
2、修改yarn-site.xml
    指定开启聚合功能
    指定日志存放在HDFS上的时间期限,一般建议3-7天左右,存放在HDFS的/tmp/用户之下

<property>
	<name>yarn.log-aggregation-enable</name>
	<value>true</value>
</property>
<property>
	<name>yarn.log-aggregation.retain-seconds</name>
	<value>106800</value>
</property> 

3、指定存放已经完成的Hadoop的作业记录(可以采用默认)

<property>
	<name>mapreduce.jobhistory.done-dir</name>
	<value>${yarn.app.mapreduce.am.staging-dir}/history/done</value>
</property>

4、指定存放的正在运行的Hadoop作业记录(可以采用默认)

<property>
	<name>mapreduce.jobhistory.intermediate-done-dir</name>
	<value>${yarn.app.mapreduce.am.staging-dir}/history/done_intermediate</value>
	<description></description>
</property>

5、提交job作业记录的目录位置(可以采用默认)

<property>
	<name>yarn.app.mapreduce.am.staging-dir</name>
	<value>/tmp/hadoop-yarn/staging</value>
	<description>The staging dir used while submitting jobs.</description>
</property>

三、测试

1、重启yarn进程

2、开启historyserver服务

sbin/mr-jobhistory-daemon.sh start historyserver

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值