hive return code 2的问题

在执行包含12个MR任务的Hive脚本时,遇到第5个任务返回错误2,疑似由于内存不足导致。通过拆分语句并增加数据落地步骤以减少内存使用,问题得到解决。参考Stack Overflow讨论,该错误可能是内存管理问题。
摘要由CSDN通过智能技术生成

 

 

在执行脚本:

 

create table liuchengtmp1_%CHINDAASDATE% as
	select a.markcode, a.xiangmu, 
	case when instrfun(xiangmu,'已注册(') >0 THEN '已注册'
		 when instrfun(xiangmu,'初步审定(') >0 THEN '初步审定'
		 ELSE XIANGMU
	END XIANGMU_new
	from f_tm_process_hdfs_ext_%CHINDAASDATE%  a 
	join (

	select max(fliuc_id) fliucid1 from f_tm_process_hdfs_ext_%CHINDAASDATE% a join
  (select a.markcode,max(a.liuchengdate) maxliuchendate,max(a.fliuc_idt) maxfliucidt 
  from f_tm_process_hdfs_ext_%CHINDAASDATE% a join 
  (select
  markcode,
  max(liuchengdate) maxliuchendate
  from f_tm_process_hdfs_ext_%CHINDAASDATE% group by markcode) b
  on a.markcode = b.markcode and a.liuchengdate = b.maxliuchendate
  group by a.markcode) c
  on a.markcode = c.markcode and a.liuchengdate = c.maxliuchendate and a.fliuc_idt = c.maxfliucidt
  group by a.markcode;  )  e on (a.fliuc_id = e.fliucid1);
  

 

脚本分拆成12个mr任务,在执行到第5个mr任务的时候报错如下:



 

 

网上找了好多资料,有的说这不是个错,有的说是内存不够造成,看上面报错截图,内存使用一直在增加,

因此估计是内存不够了,

 

后来处理措施为,将上述语句拆分成2步来执行,中间有一次数据落地,这样防止将所有数据都放在内存中执行,如下:

drop table if exists liuchengtmp_%CHINDAASDATE%;  
create table liuchengtmp_%CHINDAASDATE% as
	select max(fliuc_id) fliucid1 from f_tm_process_hdfs_ext_%CHINDAASDATE% a join
  (select a.markcode,max(a.liuchengdate) maxliuchendate,max(a.fliuc_idt) maxfliucidt 
  from f_tm_process_hdfs_ext_%CHINDAASDATE% a join 
  (select
  markcode,
  max(liuchengdate) maxliuchendate
  from f_tm_process_hdfs_ext_%CHINDAASDATE% group by markcode) b
  on a.markcode = b.markcode and a.liuchengdate = b.maxliuchendate
  group by a.markcode) c
  on a.markcode = c.markcode and a.liuchengdate = c.maxliuchendate and a.fliuc_idt = c.maxfliucidt
  group by a.markcode; 
  


drop table if exists liuchengtmp1_%CHINDAASDATE%;	
create table liuchengtmp1_%CHINDAASDATE% as
	select a.markcode, a.xiangmu, 
	case when instrfun(xiangmu,'已注册(') >0 THEN '已注册'
		 when instrfun(xiangmu,'初步审定(') >0 THEN '初步审定'
		 ELSE XIANGMU
	END XIANGMU_new
	from f_tm_process_hdfs_ext_%CHINDAASDATE%  a 
	join liuchengtmp_%CHINDAASDATE% b 
	on (a.fliuc_id = b.fliucid1);

 

修改后,执行,不在报错

 

下面是参考链接,值得看看老外们的说法:

http://stackoverflow.com/questions/11185528/what-is-hive-return-code-2-from-org-apache-hadoop-hive-ql-exec-mapredtask/11248618

 

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值