HiveSql一天一个小技巧:高阶多维聚合函数应用

目录

0 需求背景

1 高阶函数使用

2 小结


0 需求背景

    实际生产中,各种指标的报表统计,往往都会涉及到多维分析,比如,统计日活数,日会话次数,日回头访客数,日新,日用户平均访问时长,访问深度……都需要从不同维度,各种角度去分析,如下图1所示的统计需求,统计其访问深度需要做层次查询,或做多个维度的统计分析,如图2所示,面对此类需求我们应该如何做呢?一种我们可以采用UNION ALL的方式实现,但这种方式比较麻烦工作量大,代码繁琐也不便于维护,另一种就是采用Hive中为我们提供的高阶函数进行求解。
 

图1
图2

1 高阶函数使用

我们以如下案例来引出我们Hive中高阶函数的使用方法

表结构如下:

create table t

(

 province_name       string        comment '省份名称'

,city_name           string        comment '城市名称'

,area_name           string        comment '地区名称'

,people_cnt          int           comment '人口数量'

,amt                 decimal(16,2) comment 'GDP'

)

row format delimited fields terminated by ','


create table t as 
select '广东' as  province_name,'广州' as city_name ,'白云区' as area_name,100 as people_cnt,30 as amt
union all
select '广东' as  province_name,'广州' as city_name ,'番禺区' as area_name,120 as people_cnt,45 as amt
union all
select '广东' as  province_name,'深圳' as city_name ,'福田区' as area_name,200 as people_cnt,67 as amt
union all
select '广东' as  province_name,'深圳' as city_name ,'南山区' as area_name,290 as people_cnt,167 as amt
union all
select '浙江' as  province_name,'杭州' as city_name ,'萧山区' as area_name,80 as people_cnt,20 as amt
union all
select '浙江' as  province_name,'杭州' as city_name ,'滨江区' as area_name,120 as people_cnt,50 as amt
union all
select '浙江' as  province_name,'宁波' as city_name ,'江东区' as area_name,80 as people_cnt,20 as amt
union all
select '浙江' as  province_name,'宁波' as city_name ,'江北区' as area_name,45 as people_cnt,10 as amt

表数据如下:


                
  • 9
    点赞
  • 26
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值