问题描述
在 hive 中执行以下 sql:
select av_seq, cp_seq from dw.smbrandcp group by av_seq;
提示报错:
FAILED: SemanticException [Error 10025]: Line 1:15 Expression not in GROUP BY key 'cp_seq'
错误分析
很显然,错误信息已经告诉我们了这是一个语法错误。当使用 group by 子句时, select 语句只能包含 group by 子句中的字段。当然 select 语句中也可以有多个聚合函数 (例如 count)。
在本例中,smbrandcp 表大致如下:
av_seq | cp_seq |
---|---|
944076 | CC200940 |
944076 | CC200743 |
944076 | CC200777 |
在执行下面的查询时:
select av_seq, cp_seq from dw.smbrandcp group by av_seq;
由于只是在 av_seq 字段上面做聚合,那么对于聚合操作 av_seq = 944076, cp_seq 应该取什么样的值呢?这样就会产生多种可能选项。Hive 对于这种字段在 select 语句中而不在 group by 子句中的 SQL 的处理方式就是将其当做一个无效 SQL, 因为 HQL 要的就是精确。