hadoop1.0 TaskTracker因为分布式缓存导致内存泄露的一次问题排查

本文详细描述了一次由于分布式缓存导致Hadoop 1.0 TaskTracker内存泄漏的问题排查过程。通过检查磁盘空间、进程日志、GC日志和内存映射,发现TaskTracker因老年代内存满而频繁进行Full GC,影响任务执行。进一步分析发现TaskTracker的分布式缓存相关对象数量异常,可能存在问题。通过查找Apache Hadoop的JIRA,确认了这是一个已知问题,并提供了解决方案——在job完成后清理分布式缓存。
摘要由CSDN通过智能技术生成

       上周五同事到公司说凌晨的时候有值班同事打电话给他,有部分job卡住了,运行了很长时间都没运行完成,由于是凌晨,他没来得及详细的查看日志,简单的把有问题的tasktracker重启了一下,只有一个节点的TaskTracker进程停掉,让我查一下具体是什么问题。以下是排查过程:

1、登陆到停掉TT进程的处理机

(1)、查看磁盘空间


磁盘没有出现空间不足的情况。 

(2)、top查看负载和内存使用情况:


根据上图看出内存和负载都不算高,也不存在僵尸进程。

2、查看进程日志

1、log4j日志:

2014-11-28 06:47:43,813 INFO org.apache.hadoop.mapred.TaskTracker: Trying to launch : attempt_201406171104_5451817_m_001292_0 which needs 1 slots
2014-11-28 06:47:43,813 INFO org.apache.hadoop.mapred.TaskTracker: In TaskLauncher, current free slots : 3 and trying to launch attempt_201406171104_5451817_m_001292_0 which needs 1 slots
2014-11-28 06:47:43,814 INFO org.apache.hadoop.mapred.JvmManager: In JvmRunner constructed JVM ID: jvm_201406171104_5451797_m_-1554592361
2014-11-28 06:47:43,814 INFO org.apache.hadoop.mapred.JvmManager: JVM Runner jvm_201406171104_5451797_m_-1554592361 spawned.
2014-11-28 06:47:43,821 INFO org.apache.hadoop.mapre
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值