关于"failed to report status for 600 seconds. killing"的错误

在做CPU密集型的MR任务时,有时会出现failed to report status for 600 seconds. killing的错误,分析了一下,是因为task长时间在跑任务,没有向jobtracker发送心跳包。 有以下方法可以改善这个问题。

1. 延长task超时时间

这种方法通过修改配置项mapred.task.timeout来延长超时时间。 默认是600000ms,可以根据任务的不同在相应job的configuration配置。 或者修改hadoop系统的配置文件更改全局配置。

在mapred-site.xml里面多加上
<property>
<name>mapred.task.timeout</name>
<value>600000</value><!--這是預設-->
</property>

更换这个属性,设置成0表示不限制。
conf.set("mapred.task.timeout","0");...結果是一樣的

2. 手动汇报

在task里可以定期调用org.apache.hadoop.mapreduce.TaskAttemptContext.progress()来向jobtracker发送心跳包,防止任务超时。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值