Hadoop执行Job时因超时自动kill原因及解决方案

最新推荐文章于 2024-07-28 22:35:19 发布

Olav

最新推荐文章于 2024-07-28 22:35:19 发布

阅读量3.9k

点赞数

分类专栏： Hadoop 文章标签： hadoop

Hadoop 专栏收录该内容

2 篇文章 0 订阅

订阅专栏

转自：http://snv.iteye.com/blog/1879983

Hadoop执行Job时因超时自动kill，信息如下：

    Java代码   
    
 Task attempt_201305231045_3281_m_000003_0 failed to report status for 600 seconds. Killing!

原因：

1.执行MR的时间过长，超过了mapred.task.timeout 中设置的值

2.MR执行中因业务比较复杂，没有report status从而使得master感觉不到此task的存在而kill

解决方案：

方案1：修改mapred-site.xml：

    Java代码   
    
  
 <property>  
     <name>mapred.task.timeout</name>  
     <value>600000</value><!--默认为600S-->可以改的更长！  
 </property>  

方案2：根据业务需要手动set值：

    Java代码   
    
 conf.setLong("mapred.task.timeout", 900000L);

但在hadoop0.20.2中貌似最大值限制：36,000,000 ms，顾采用方案3比较可靠

方案3：定时report status

在Mapper或者Reducer的时候，执行复杂的业务操作的时候report status

    Java代码   
    
 context.progress();

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Olav

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
2
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

hadoop之failed task和killed task

快乐程序员的专栏

10-09

7779

failed task可理解为自杀，也就是task本身出了问题而自杀；killed task可理解为是他杀，也就是jobtracker认为这个任务的执行是多余的，所以把任务直接杀掉。起初用hadoop的时候经常在一个complete的job中看到几个failed 或者是 killed task，还经常好奇为什么有的时候task的失败不会影响到整个job的失败，而有的时候就会使整个job的失败，到底

hdfs相关问题及解决方案归档

weixin_44976835的博客

08-26

2786

目录问题1：reduce预处理阶段shuffle时获取已完成的map的输出失败次数超过上限问题2：Too many fetch-failures问题3：处理MR速度特别的慢问题4：能够启动datanode，但无法访问，也无法结束问题5：节点断联问题6：JVM内存不够问题7：Hadoop添加节点的方法问题8：给单个node新加硬盘问题9：IO写操作出现问题问题10：HDFS退服节点的方法问题11：IO异常问题12：status of 255 error问题13：sort by value问题14：restar

2 条评论您还未登录，请先登录后发表或查看评论

hadoop job kill

YouAreLion的博客

05-30

480

$ hadoop job -list $ hadoop job -kill job_2018xxxxxxxxx_12345

CI/CD：Job failed: execution took longer than 1h0m0s seconds

最新发布

we chat：玩转测试开发

07-28

233

当在CI/CD配置运行Gitlab-runner流水线中，一般默认情况下，Job的执行时间默认为1小时，如果超出1小时，任务会中断。：前往CI/CD Settings 修改Timeouts默认参数。：必须为10分钟或更长时间，且不超过一个月。

如何kill掉hadoop正在执行的jobs

Tate的博客

12-24

2138

当MapReduce任务不能正常执行时，我们可以将该任务kill掉。使用 hadoop job -list 列出当前hadoop正在执行的jobs。可以查看到job任务的编号，然后使用命令： hadoop job -kill job编号来杀死该job任务。 ...

Hadoop总结

CharlesDavid

12-29

1066

Hadoop总结文章目录Hadoop总结Hadoop概述Hadoop核心组件Hadoop优势分布式文件系统 HDFSHDFS架构HDFS设计思路HDFS环境搭建HDFS的使用HDFS shell操作HDFS shell操作练习资源调度框架 YARN什么是YARNYARN产生背景YARN的架构和执行流程YARN环境搭建分布式处理框架 MapReduce什么是MapReduceMapReduce编程模型Hadoop Streaming 实现wordcount （实验了解）MapReduce实战利用MRJob

Hadoop配置归档

weixin_44976835的博客

08-24

296

Hadoop常用端口配置 1.HDFS端口参数描述默认配置文件例子值 fs.default.name namenode RPC交互端口 8020 core-site.xml hdfs://master:8020/ dfs.http.address NameNode web管理端口 50070 hdfs-site.xml 0.0.0.0:50070 dfs.datanode.address datanode　控制端口 50010 hdfs-site.xml 0.0.0.0:5

Hadoop大数据集群搭建详细教程

dx1313113的博客

08-21

1485

etc /vsftpd/ftpusers文件专门用于定义不允许访问FTP服务器的用户列表（注意:如果 userlist_enable=YES,userlist_deny=NO,此时如果在vsftpd.user_list和ftpusers中都有某个用户时，那么这个用户是不能够访问FTP的，即ftpusers的优先级要高）。当设置了该配置项后，用户登陆服务器后，系统就会到/etc/vsftpd/userconf目录下，读取与当前用户名相同的文件，并根据文件中的配置命令，对当前用户进行更进一步的配置。

[Hadoop] hadoop 2.7完全分布式高可用部署

人生所向，皆是美好

01-20

767

文章目录1. hadoop ha 原理描述2. 集群规划3. 集群服务器准备1. 配置IP和主机名称映射2. 关闭防火墙3. 关闭selinux4. 同步时间5. 配置sudo权限6. 安装jdk环境7. 切换用户配置ssh免密登录8. 安装zookeeper集群4. 集群安装1. 下载包hdoop-2.7.7.tar.gz2. 配置hadoop文件3. 配置环境变量4. 分发安装包到其它主机4....

Kill运行中的JOB的问题

01-11

314

[@more@] 系统中有一个JOB，由于SQL编写的问题，导致运行了5个多小时还没完，我想把它kill掉。 1. 首先我得查看正在跑的JOB有哪些：SELECT /*+ RULE */ * ...

【若泽大数据实战第十四天】YARN 生产详解

强悍de巨人

05-29

785

前言：上节课我们讲了 MR job的提交Yarn的工作流程Yarn的工作流程MR架构设计Yarn（主从）资源 + 作业调度管理Yarn：是一种新的 Hadoop资源管理器，它是一个通用资源管理系统，可为上层应用提供统一的资源管理和调度，它的引入为集群在利用率、资源统一管理和数据共享等方面带来了巨大好处。ResourceManager(RM)：主要接收客户端任务请求，接收和监控NodeManag...

hadoop之datanode节点超时时间设置与HDFS冗余数据块的自动删除

ZG_24的博客

06-17

1846

一 Datanode节点超时时间设置datanode进程死亡或者网络故障造成datanode无法与namenode通信，namenode不会立即把该节点判定为死亡，要经过一段时间，这段时间暂称作超时时长。HDFS默认的超时时长为10分钟+30秒。如果定义超时时间为timeout，则超时时长的计算公式为： timeout = 2 * heartbeat.recheck.interval + 10...

解决yarn上的MapReduce作业失败问题container XXXX is running beyond physical memory limits

一个爱搞技术的C.的博客

11-26

1009

使用hive运行MR任务时出现内存不足的问题： SLF4J: Class path contains multiple SLF4J bindings. SLF4J: Found binding in [jar:file:/home/whzy/opt/hive-2.1.1/lib/log4j-slf4j-impl-2.4.1.jar!/org/slf4j/impl/StaticLoggerBi...

【异常问题】Hive中SQL执行mapreduce.task.timeout超时问题