在写SQL的时候,如果group by的column 比较复杂,有的数据库中可以写成 group by position
的形式,如:
SELECT
CASE WHEN a.f1=1 THEN 'a' WHEN a.f1=2 THEN 'b' ELSE c END AS col1,
sum(a.f2) AS col2
FROM a
GROUP BY 1;
Hive中可以通过设置
set hive.groupby.position.alias=true
打开这个功能。类似的设置还有一个
set hive.orderby.position.alias=true
可以在order by
中启用相同的功能.
SELECT
CASE WHEN a.f1=1 THEN 'a' WHEN a.f1=2 THEN 'b' ELSE c END AS col1,
sum(a.f2) AS col2
FROM a
GROUP BY 1
ORDER BY 2;
不过有意思的是,这里Hive可能有个bug:
1. order by 2
会提示找不到column f2
,其实这里应该会映射成col2才对
以上参数基于Hive 2.3.2设置. Hive 2.2.0之前的版本用
hive.groupby.orderby.position.alias
参数