hive执行分区修复语句(MSCK REPAIR TABLE)时报FAILED: Execution Error, return code 1 from org.apache.hadoop.hive.

本文讲述了在shell脚本中执行Hive分区修复(MSCKREPAIRTABLE)时遇到的错误,原因是Hive对分区目录的验证。提供了解决方案,包括设置`hive.msck.path.validation=ignore`以及在删除HDFS目录后手动删除对应Hive分区。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

问题描述

在shell脚本中,hive执行分区修复语句(MSCK REPAIR TABLE)时报错。错误如下

FAILED: Execution Error, return code 1 from org.apache.hadoop.hive.ql.exec.DDLTask

原因分析:

默认情况下,Hive会验证表中每个分区对应的hdfs目录是否存在,并且与元数据中定义的分区信息是否一致。如果发现任何不匹配或缺失的分区目录,Hive将抛出错误并停止执行 MSCK REPAIR TABLE 命令。
我的错误原因:我在调度平台使用shell脚本执行定时任务,每次都会删除hdfs的目录,导致hive表分区与hdfs目录不匹配,所以报错。


解决方案:

1. set hive.msck.path.validation=ignore

在shell脚本中的MSCK REPAIR TABLE命令之前添加set hive.msck.path.validation=ignore,通过设置 hive.msck.path.validation=ignore; ,你告诉Hive忽略无效路径验证。这意味着当执行 MSCK REPAIR TABLE 时,即使存在不匹配或缺失的分区目录,在报错之前也会继续进行修复操作。它允许你跳过某些问题而继续修复其他有效部分。

2. 在每次删除hdfs目录时,删除对应的hive分区

查看hive分区:

SHOW PARTITIONS table_name;

查看hdfs目录:

hdfs dfs -ls /hive对应的hdfs目录

根据hive分区检查出已经删除的hdfs目录,然后删除这些hdfs目录对应的hive分区:

alter table hive_external_table_name drop partition(day='2024-01-11')

删除之后执行:MSCK REPAIR TABLE hive_external_table_name,执行成功

然后修改shell脚本,在hdfs dfs -rm -r /hive对应的hdfs目录后添加alter table hive_external_table_name drop partition(day='2024-01-11')

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

BigDataMagician

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值