HiveSQL行转列lateral view explore()以及连接concat_ws()和列转行collect_list()&collect_set()区别的使用案例

本文介绍了如何使用HiveSQL进行数据统计分析,通过lateral view explore()函数将行转列,便于对每个数据项进行统计分析。同时,通过concat_ws()和collect_list()、collect_set()进行列转行处理,实现数据的聚合展示。通过实例展示了这两个操作在处理人生阶段数据时的应用。
摘要由CSDN通过智能技术生成

行转列:

在我们使用hive进行数据统计分析时可能有这么一个场景:

一行数据中,一个字段中有很多和数据项,我们需要对每个数据项进行一个统计分析。

例如:一个人有很多人生的重要阶段,我们有一批人,求在某个阶段的人的总数

uid,stage

1,jiehun:shengzi:maiche
2,maiche:maifang
3,maifang:jiehun
4,dushu:maiche
5,dushu:maifang:jiehun
6,shangban:maiche
7,shangban:maifang:jiehun

需求:分析 结婚阶段的多少人,买车阶段的多少人等等,如果我们能把数据变成下列形式的话进行分组聚合就简单了,就是把stages这一列打开,对应到每个人,这样我们直接按照stage分组,聚合一下就是结果。

uid ,stage
 1,jiehun  
 1,shengzi 
 1,maiche  
 2,maiche  
 2,maifang 
 3,maifang 
 3,jiehun  
 4,dushu   
 4,maiche  
 5,dushu   
 5,maifang 
 5,jiehun  

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值