【yarn】任务日志丢失问题分析

当一个实时任务在YARN上运行时挂掉,发现任务日志消失。通过检查任务结束时间、节点日志,发现日志丢失可能由于找不到用户导致。经过官方文档查询及社区讨论,推测可能是运维操作影响了用户名,从而导致容器启动失败和日志丢失。通过此问题分析,增加了故障排查经验。
摘要由CSDN通过智能技术生成

【yarn】任务日志丢失问题分析

故事背景

今天中午收到了一个报警邮件通知。内容大致为:有一个正在 yarn上运行的flink的实时任务挂掉了。
针对上述的现象,我们的开发工程师先打开yarnweb ui找到对应的job的任务页面。查询任务日志。
在这里插入图片描述
点击这个log,找不到任何日志。那么很显然,这个任务的container已经没了,日志已经找不到了。
引出问题:日志怎么会消失?

探究过程

  1. 通过上图的Finished这一栏可以看到,这个任务在什么时候结束运行的,从上图得知,这个任务是在Wed Nov 16 12:58:09 +0800 2022挂掉的。
  2. 记录最下面Node栏对应的机器ip(在上面的图片中我打码了,这个机器是yarn的一个node节点,请根据自己的环境来分析)
  3. 在做好上述两点的基础上,先找到这台Node节点,然后检查该节点的NodeManager的日志,目前我用的环境是cdh,所以我可以在
  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值