sqlite查询乘以某列如果是null就换成_大数据之Hive group by with cube/rollup分组查询...-CSDN博客

本文链接：https://blog.csdn.net/weixin_39901203/article/details/111382893

本文介绍了在Hive中使用group by配合grouping sets()、with cube和with rollup进行多字段分组查询的方法。讨论了grouping_id在处理null值时的角色，以及开源Hive与华为云MRS集群Hive中grouping_id的不同计算方式。通过这些技术，可以简化复杂的SQL查询组合，提高效率。

摘要由CSDN通过智能技术生成

group by

sql 查询时，我们常将聚合函数和group by 结合起来对某一个或多个字段进行分组查询，例如：

 select addcode,count(distinct sbtid)uv from tb_hive_window group by addcode;+----------+-----+| addcode  | uv  |+----------+-----+| 0002     | 2   || 000201   | 1   || 000202   | 1   || 000205   | 1   || 000206   | 1   || 000208   | 2   |+----------+-----+

group by fields ... grouping sets ()

有时候因业务需要，我们需要group by 多个字段，例如：

select addcode,count(distinct sbtid)uv from tb_hive_window group by addcode;select rscode,count(distinct sbtid)uv from tb_hive_window group by rscode;select addcode,rscode,count(distinct sbtid)uv from tb_hive_window group by addcode,rscode;//这种情况我们需要写3条sql 语句

通过grouping sets (), 我们可以通过一条sql 完成，相当于是将上面三条语句执行的结果通过union all 组合起来。

select addcode,rscode,count(*)pv,count(distinct sbtid)uv,grouping__id from tb_hive_window group by addcode,rscode grouping sets ((addcode,rscode),(addcode),(rscode));+----------+---------+-----+-----+---------------+| addcode  | rscode  | pv  | uv  | grouping__id  |+----------+---------+-----+-----+---------------+| NULL     | 34      | 1   | 1   | 2             || NULL     | 35      | 5   | 3   | 2             || NULL     | 40      | 1   | 1   | 2             || NULL     | 65      | 1   | 1   | 2             || NULL     | 351     | 1   | 1   | 2             || NULL     | 352     | 1   | 1   | 2             || NULL     | 395