求助，FAILED: Execution Error, return code 2 from org.apache.hadoop.hive.ql.exec.mr.MapRedTask

最新推荐文章于 2023-11-04 18:28:23 发布

面向搜索引擎写bug

最新推荐文章于 2023-11-04 18:28:23 发布

阅读量227

点赞数

分类专栏： ETL 大数据文章标签： hive

本文链接：https://blog.csdn.net/weixin_42867475/article/details/116197295

版权

ETL 同时被 2 个专栏收录

7 篇文章 0 订阅

订阅专栏

大数据

7 篇文章 1 订阅

订阅专栏

在执行hive sql的过程中发现报错如下

Ended Job = job_1617789732059_139915 with errors
Error during job, obtaining debugging information...
Examining task ID: task_1617789732059_139915_m_000000 (and more) from job job_1617789732059_139915

Task with the most failures(4): 
-----
Task ID:
  task_1617789732059_139915_m_000000

URL:
  http://0.0.0.0:8088/taskdetails.jsp?jobid=job_1617789732059_139915&tipid=task_1617789732059_139915_m_000000
-----
Diagnostic Messages for this Task:
Error: java.io.IOException: java.lang.reflect.InvocationTargetException
	at org.apache.hadoop.hive.io.HiveIOExceptionHandlerChain.handleRecordReaderCreationException(HiveIOExceptionHandlerChain.java:97)
	at org.apache.hadoop.hive.io.HiveIOExceptionHandlerUtil.handleRecordReaderCreationException(HiveIOExceptionHandlerUtil.java:57)
	at org.apache.hadoop.hive.shims.HadoopShimsSecure$CombineFileRecordReader.initNextRecordReader(HadoopShimsSecure.java:267)
	at org.apache.hadoop.hive.shims.HadoopShimsSecure$CombineFileRecordReader.<init>(HadoopShimsSecure.java:213)
	at org.apache.hadoop.hive.shims.HadoopShimsSecure$CombineFileInputFormatShim.getRecordReader(HadoopShimsSecure.java:334)
	at org.apache.hadoop.hive.ql.io.CombineHiveInputFormat.getRecordReader(CombineHiveInputFormat.java:695)
	at org.apache.hadoop.mapred.MapTask$TrackedRecordReader.<init>(MapTask.java:169)
	at org.apache.hadoop.mapred.MapTask.runOldMapper(MapTask.java:438)
	at org.apache.hadoop.mapred.MapTask.run(MapTask.java:343)
	at org.apache.hadoop.mapred.YarnChild$2.run(YarnChild.java:164)
	at java.security.AccessController.doPrivileged(Native Method)
	at javax.security.auth.Subject.doAs(Subject.java:422)
	at org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation.java:1920)
	at org.apache.hadoop.mapred.YarnChild.main(YarnChild.java:158)
Caused by: java.lang.reflect.InvocationTargetException
	at sun.reflect.NativeConstructorAccessorImpl.newInstance0(Native Method)
	at sun.reflect.NativeConstructorAccessorImpl.newInstance(NativeConstructorAccessorImpl.java:62)
	at sun.reflect.DelegatingConstructorAccessorImpl.newInstance(DelegatingConstructorAccessorImpl.java:45)
	at java.lang.reflect.Constructor.newInstance(Constructor.java:423)
	at org.apache.hadoop.hive.shims.HadoopShimsSecure$CombineFileRecordReader.initNextRecordReader(HadoopShimsSecure.java:253)
	... 11 more
Caused by: java.io.FileNotFoundException: File does not exist: hdfs://nameservice1/user/hive/warehouse/dmr_sal.db/dmr_sal_mon_rep/7b45c6419f860a05-6c8a158a00000006_963415448_data.0.parq
	at org.apache.hadoop.hdfs.DistributedFileSystem$20.doCall(DistributedFileSystem.java:1269)
	at org.apache.hadoop.hdfs.DistributedFileSystem$20.doCall(DistributedFileSystem.java:1261)
	at org.apache.hadoop.fs.FileSystemLinkResolver.resolve(FileSystemLinkResolver.java:81)
	at org.apache.hadoop.hdfs.DistributedFileSystem.getFileStatus(DistributedFileSystem.java:1261)
	at parquet.hadoop.ParquetFileReader.readFooter(ParquetFileReader.java:386)
	at parquet.hadoop.ParquetFileReader.readFooter(ParquetFileReader.java:372)
	at org.apache.hadoop.hive.ql.io.parquet.read.ParquetRecordReaderWrapper.getSplit(ParquetRecordReaderWrapper.java:252)
	at org.apache.hadoop.hive.ql.io.parquet.read.ParquetRecordReaderWrapper.<init>(ParquetRecordReaderWrapper.java:95)
	at org.apache.hadoop.hive.ql.io.parquet.read.ParquetRecordReaderWrapper.<init>(ParquetRecordReaderWrapper.java:81)
	at org.apache.hadoop.hive.ql.io.parquet.MapredParquetInputFormat.getRecordReader(MapredParquetInputFormat.java:72)
	at org.apache.hadoop.hive.ql.io.CombineHiveRecordReader.<init>(CombineHiveRecordReader.java:68)
	... 16 more


FAILED: Execution Error, return code 2 from org.apache.hadoop.hive.ql.exec.mr.MapRedTask
MapReduce Jobs Launched: 
Stage-Stage-1: Map: 1  Reduce: 1   Cumulative CPU: 19.4 sec   HDFS Read: 183828 HDFS Write: 128142 SUCCESS
Stage-Stage-11: Map: 1  Reduce: 1   HDFS Read: 0 HDFS Write: 0 FAIL
Total MapReduce CPU Time Spent: 19 seconds 400 msec
WARN: The method class org.apache.commons.logging.impl.SLF4JLogFactory#release() was invoked.
WARN: Please see http://www.slf4j.org/codes.html#release for an explanation.

但是这个sql 语句和表是没有任何问题的，大多时候都可以成功，但偶尔会出现不成功问题，通过大佬得知，这个是因为集群问题引起的，重跑就可以了，当然有哪个大佬知道更好的解决办法求指教，由于我这边是通过定时来处理的所以得用shell 来判断 sql语句是否执行成功再决定执不执行下一步
$? 可以获取上条语句执行的状态
在写个while 循环重跑就可以了

#!/bin/bash
i=5
while let i-- ;do
        echo '执行语句'
        echo $i
        if [ $? -eq 0 ];then
        echo $i
        break
        fi
done

如果哪个大哥有更好的解决方式了，麻烦给我分享一下（不要改集群配置的那种，生产集群不是我想改就能改的）

面向搜索引擎写bug

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录