问题1:问下,hive 数据通过discp 拷贝后 ,数据为啥查不出来,新的集群在拷贝前已创建新库(是分区表)
解决方法:修复下分区就好了
msck repair table table_name
问题2:hive insert into 插入数据后表中原来的数据丢失了
是否在表名加了这种`号
DatabaseName
如果是建议你使用以下这种方式处理转义字符,可以正常insert into.
TableName
db
例如,insert into.
tableAselect t.a, t.b from tableB t
DatabaseName.TableName`时语法解析为OVERWRITE,该问题为apache社区问题。在当前版本的hive中还未修复
问题原因:使用
使用分区时,注意点
当使用 count(distinct col)而同时col是分区列时,存在结果为0的bug
因此在设计表结果时需要考虑到分区字段是否会被count