Hive的行列转换

行转列

concat

返回输入字符串连接后的结果,支持任意个输入字符串
select concat('a','b','c');
-- 结果 abc

:'
需要注意的地方
如果是拼接的字符串中有标点符号,比如';'
需要转义
concat('a',';')     会报错
concat('a','\;')    正确
另外,如果concat函数中有一个字符串为null,那么最后返回的结果也为null
concat('a','b',null,'c')
'

concat_ws

它是一个特殊形式的 CONCAT();
第一个参数是剩余参数间的分隔符;分隔符可以是与剩余参数一样的字符串.
如果分隔符是 NULL,返回值也将为 NULL. 
这个函数会跳过分隔符参数后的任何 NULL 和空字符串,分隔符将被加到被连接的字符串之间;
select concat_ws('-','c','b','a');
-- 结果 c-b-a
select concat_ws('-','c','','b',null,'a');
-- 结果 c--b-a

collect_set

函数只接受基本数据类型,它的主要作用是将某字段的值进行去重汇总,产生array类型字段.  
nameconstellationblood_type
孙悟空白羊座A
大海射手座A
宋宋白羊座B
猪八戒白羊座A
凤姐射手座A
苍老师白羊座B
需求:把星座和血型一样的人归类到一起
结果如下:
射手座,A            大海|凤姐
白羊座,A            孙悟空|猪八戒
白羊座,B            宋宋|苍老师
select 
t.temp
concat_ws('|',collect_set(t.name)) 
from(
select name,concat(constellation,',',blood_type) as temp from person_info
)t
group by t.temp;

列转行

explode

将hive一列中复杂的array或者map结构拆分成多行.(col要是array或者map类型)

lateral view

用法: LATERAL VIEW udtf(expression) tableAlias AS columnAlias
解释: 用于和split,explode等UDTF一起使用,它能够将一列数据拆成多行数据,在此基础上可以对拆分后的数据进行聚合.
moviecategory
《疑犯追踪》悬疑,动作,科幻,剧情
《Lie to me》悬疑,警匪,动作,心理,剧情
《战狼2》战争,动作,灾难
需求:将电影分类中的数组数据展开
《疑犯追踪》      悬疑
《疑犯追踪》      动作
《疑犯追踪》      科幻
《疑犯追踪》      剧情
《Lie to me》   悬疑
《Lie to me》   警匪
《Lie to me》   动作
《Lie to me》   心理
《Lie to me》   剧情
《战狼2》        战争
《战狼2》        动作
《战狼2》        灾难
select 
movie,cat
from
movie_info
lateral view explode(split(category,',')) t as cat;
  • 22
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

早拾碗吧

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值