使用数据仓库HIVE遇到的几个坑

在Hive1.2.2版本中,使用InsertOverwrite时需注意指定不存在的目标目录,否则可能清除已有数据。同时,进行计算字段排序时,必须使用别名,直接使用计算字段会导致错误。示例查询展示了正确的和错误的用法。避免此类问题,建议多查阅官方文档。
摘要由CSDN通过智能技术生成

软件版本

hive1.2.2

遇到的问题

1、insert overwrite导出数据时,需要指定一个不存在的目录,否则可能会清空已存在目录下的所有内容。
2、对于参与计算的字段排序时,需要使用别名进行排序,而不能使用参与计算的字段。
例如:
select ‘F’ as sex,b.moviename,count(b.moviename),avg(c.rate)
from t_rating c ,t_user a,t_movie b
where c.userid=a.userid and c.movieid=b.movieid and t_user.sex=‘F’
group by b.moviename
having count(b.moviename) >=50
order by avg(c.rate) desc
limit 10

FAILED: SemanticException [Error 10004]: Line 6:13 Invalid table alias or column reference ‘a’: (possible column names are: sex, c.moviename, _c2, _c3)

select ‘F’ as sex,c.moviename,count(c.moviename),avg(a.rate) as avgrate
from t_rating a ,t_user b,t_movie c
where a.userid=b.userid and a.movieid=c.movieid and b.sex=‘F’
group by c.moviename
having count(c.moviename) >=50
order by avgrate desc
limit 10

总结

1、单表排序是否也有该问题
2、有空多看看官方文档,应该能避免问题1的出现

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值