hive开发遇到的问题

问题1:问下,hive 数据通过discp 拷贝后 ,数据为啥查不出来,新的集群在拷贝前已创建新库(是分区表)
解决方法:修复下分区就好了
msck repair table table_name

问题2:hive insert into 插入数据后表中原来的数据丢失了
是否在表名加了这种`号
如果是建议你使用以下这种方式处理转义字符,可以正常insert into
DatabaseName.TableName
例如,insert into
db.tableAselect t.a, t.b from tableB t
问题原因:使用
DatabaseName.TableName`时语法解析为OVERWRITE,该问题为apache社区问题。在当前版本的hive中还未修复

使用分区时,注意点
当使用 count(distinct col)而同时col是分区列时,存在结果为0的bug
因此在设计表结果时需要考虑到分区字段是否会被count

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值