hive中实现行转列_Hive行转列实现Pivot

前言

传统关系型数据库中,无论是Oracle(11g之后)还是SQLserver(2005之后),都自带了Pivot函数实现行转列功能,本文主要讲述在Hive中实现行转列的两种方式。

传统数据库方式

这种方式是借鉴在Oracle或者SQLserver在支持Pivot函数之前实现行转列的方式,实际上语法没有什么变化,只是换成了Hive。

with testtable(

select 1 id,'k1' key,123 value

union all

select 1,'k2' key,124 value

union all

select 2,'k1',234 value

)

select id,

max(case when key='k1' then value else null end) k1,

max(case when key='k2' then value else null end) k2

from testtable

group by id

Map方式

这种方式的思路是把需要转列的字段及其值字段拼接成一个Hive上的key-value的map数据,具体Sql如下:

with testtable(

select 1 id,'k1' key,123 value

union all

select 1,'k2' key,124 value

union all

select 2,'k1',234 value

)

select id,kv['k1'],kv['k2']

from (

select id,str_to_map(concat_ws(',', collect_set(concat(key, '-', value))),',','-') kv

from testtable

group by id)t

总结

两种方式都可以实现行转列的功能,传统的方式易于理解,但在key的取值比较多的时候,写起来会相当繁琐,map的方式相对要简便一些。但map的方式所有的数据都collect到一起了,对内存的要求会高一些,而传统的方式通过聚合函数直接reduce,可以边运行边求值。

备注

上面所涉及的函数均可通过Hive常用函数解析 查阅用法。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值