Hive报错FAILED: SemanticException Can not find 表名 in genColumnStatsTask

问题描述

Hive SQL直接查询可以运行成功,这一点说明SQL是没有问题的。
但是insert写入数据时报错 FAILED: SemanticException Can not find 表名 in genColumnStatsTask

执行SQL如下:(主要是一个解析json数组SQL)

insert overwrite table 表名3 partition(p_day='2022-06-27')
select id,t01.labelCode,labelName,labelLevel
from
(
    select id,label.code as labelCode,label.parentCode as parentLabelCode,label.labelLevel
    from 
    (
        select id,Labels
        from
        (
            select id,regexp_replace(regexp_replace(Label,'\\[|]',''),'\\},\\{','\\}_\\{') as Label
            from 表名1
        )t01 
        lateral view explode(split(Label,'_')) v as Labels
    )t02 
    lateral view json_tuple(Labels,'code','parentCode','labelLevel') label as code,parentCode,labelLevel
)t01
left join 
(
    select labelcode,labelvalue as labelName
    from 表名2
)t02 on t01.labelCode=t02.labelcode

原因分析:首先百度查看了几个关于这个报错的文章

1、*****这篇文章说遇到类似情况,单独执行不报错,create table as 执行会报错,原因未明。。。
在这里插入图片描述
2、****下面这个文章说在外面在加一层select 可以解决,尝试后并没有解决。。。在这里插入图片描述在这里插入图片描述

解决方案:

1、查看了直接单独执行和insert 写入 的执行计划,发现insert语句查出的数据长度要比select大很多
2、根据查看执行计划,尝试了值写入10行数据,即在SQL后面加上了 limit 10; 竟然成功了!!!
3、大胆的猜测,因为我这个只有不到10w的数据量,所以我又尝试limit 1000000;也成功了
4、问题解决了,但是至于原因还是不太清晰,看了帖子猜测是lateral view和join 或者union all 联用导致的,具体的尚不清楚
5、使用limit可以成功的原因是,使用limit 后 ,hive会先吧数据查出来落地,可能确实是数据长度导致内存不足了??有待考究

*【注】关于失败原因可能有个人猜测成分,如果不对欢迎指正,同时也欢迎大家留言讨论~

本文参考

1、https://blog.csdn.net/u014232719/article/details/106208056
2、https://stackoverflow.com/questions/70188606/semanticexception-can-not-find-table-name-in-gencolumnstatstask-state-42000-c

  • 3
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值