hadoop集群优化(三):开启日志汇聚服务

说明

hadoop平台有大量组件,上线后yarn执行全平台任务,各任务日志分散在集群各节点,为了高效追踪任务执行状态,确认异常时问题,hadoop提供了日志汇聚服务,并提供yarn页面查看,默认版本该功能关闭,需要配置开启。

分享

操作

修改配置

  • 登录hadoop102,修改文件 /opt/module/hadoop-3.3.4/etc/hadoop/yarn-site.xml 增加如下配置
  <!--开启日志聚集功能-->
  <property>
    <name>yarn.log-aggregation-enable</name>
    <value>true</value>
  </property>

  <!-- 设置日志聚集服务器地址 -->
  <property>
    <name>yarn.log.server.url</name>
    <value>http://hadoop102:19888/jobhistory/logs</value>
  </property>

  <!-- 设置日志保留时间,单位秒 -->
  <property>
    <name>yarn.log-aggregation.retain-seconds</name>
    <value>604800</value>
  </property>

分发

  • hadoop102 控制台执行:xsync /opt/module/hadoop-3.3.4/etc/hadoop/yarn-site.xml

重启集群

hadoop 自身脚本

  • 关闭NodeManager、ResourceManager、HistoryServer

    • hadoop102 关闭historyServer服务:mapred --daemon stop historyserver
    • hadoop103 关闭yarn并重启: /opt/module/hadoop-3.3.4/sbin/stop-yarn.sh
  • 启动:

    • hadoop103 启动yarn:/opt/module/hadoop-3.3.4/sbin/start-yarn.sh
    • hadoop102 启动历史服务器: mapred --daemon start historyserver

自定义脚本

  • 使用自定脚本 myhadoop,重启整个集群:myhadoop restart

总结

  • 日志记录程序执行信息,是追踪程序异常的重要依据,所有这个配置很关键,某些时候,程序本地环境测试ok,上线因为集群环境或数据引发异常,只能通过日志追踪修正。
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值