1 distinct
distinct后面跟多个字段时,会根据所有字段的组合进行去重。而不是只根据紧跟在distinct后面的那一个字段去重。
2 insert overwrite table
insert overwrite table a select xx1,xx2 from b
xx1,xx2的顺序必须与表a中字段的顺序相同,否则插进去的值位置对应错误。
3 select xx1,xx2 from t group by xx1,xx2
使用group by分组时,要求select 后面出现的列必须在group by中全部使用到。
这对group by来讲是个限制,可以使用collect_list()/collect_set()突破这种限制。Hive笔记之collect_list/collect_set(列转行)