Hive grouping sets 多维度交叉清洗数据
工作中经常会遇到需要多维度交叉清洗数据的情况,比如计算每天的活跃用户数,需要知道每天整体dau,同时也需要知道不同平台如Android、iOS各自的dua。一般情况下这种情况可能需要写两个query,第一个query仅按日期 group by,第二个query按日期+平台 group by。针对这种情况Hive提供了grouping sets可以简单方式通过一个query实现相同的效果。语法结构如下:select day_id,platform,count(distinct user_id


