hive拼接函数,行转列与列转行

拼接函数

1.concat

命令格式:
concat(string A, string B...)
参数说明:
● A,B等为string类型,若输入为bigint, double, datetime类型会隐式转换为string后参与运算,其它类型报异常。
返回值:string
用途:
返回值是将参数中的所有字符串连接在一起的结果。
备注:
如果没有参数或者某个参数为NULL,结果均返回NULL
concat(), concat(null, 'a'), concat('a', null, 'b')返回值都是NULL。

select concat(1,2,3)

2.concat_ws

命令格式:
concat_ws(STRING separator,string A, string B...)
参数说明:
● A,B等为string类型,若输入为bigint, double, datetime类型会隐式转换为string后参与运算,其它类型报异常。
返回值:string
用途:
使用指定分隔符拼接字符串。
备注:
如果没有参数或者某个参数为NULL,结果均返回NULL
concat_ws(',',null, 'a'), concat_ws(',','a', null, 'b')返回值都是NULL。

select concat_ws(',',1,2,3)

列转行

1.collect_set/collect_list

命令格式:
collect_set(string A)
用途:
实现列转行,将分组中的某列转为一个数组(array)返回。
根据某个字段分组后,把分在一组的数据合并在一起,默认分隔符’,’
备注:
collect_list不去重,collect_set去重。
常与concat_ws结合使用。

tmp表:

 

select aa
       ,collect_set(bb) as bb_1
       ,CONCAT_WS(',',collect_set(bb)) as bb
       ,collect_list(bb) as cc_1
       ,CONCAT_WS(',',collect_list(bb)) as cc
from 
(select 'a' as aa,'1' as bb
union all 
select 'a','2'
union all 
select 'b','3'
union all 
select 'a','1'
union all 
select 'b','2'
) tmp
group by aa

 

 行转列

tmp表

1.explode

用途:处理array,map类型数据。

备注:explode不能从表中产生其他列。

select explode(split(bb,','))
from (
    select aa,CONCAT_WS(',',collect_set(bb)) as bb
    from 
    (select 'a' as aa,'1' as bb
    union all 
    select 'a','2'
    union all 
    select 'b','3'
    union all 
    select 'a','1'
    union all 
    select 'b','2'
    ) t
    group by aa
) tmp

2.lateral view

用途:配合explode(或者其他的UDTF),一个语句生成把单行数据拆解成多行,即实现行转列,且解决UDTF不能添加额外列的问题。

备注:lateral view可以同时多次使用。

select aa,bbs_2
from (
    select aa,CONCAT_WS(',',collect_set(bb)) as bb
    from 
    (select 'a' as aa,'1' as bb
    union all 
    select 'a','2'
    union all 
    select 'b','3'
    union all 
    select 'a','1'
    union all 
    select 'b','2'
    ) t
    group by aa
) tmp
lateral view explode(split(bb,',')) bbs as bbs_2
;

 

 

 

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Hive中的列转行行转列是通过使用一些特定的内置函数和关键字来实现的。列转行可以使用EXPLODE函数,该函数可以将一个包含复杂结构的数组或者映射拆分成多行。行转列可以使用collect_set函数,该函数将某一列的所有数据转化为一个集合,并且可以使用concat_ws函数将集合中的所有元素以逗号分割连接成一个字符串。此外,为了使用EXPLODE和LATERAL VIEW函数,你可以使用LATERAL VIEW关键字,语法为LATERAL VIEW udtf(expression) tableAlias AS columnAlias。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* [hive列转行案例](https://download.csdn.net/download/weixin_38581777/14037437)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 33.333333333333336%"] - *2* [hive行转列列转行](https://blog.csdn.net/qq_24790473/article/details/109710145)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 33.333333333333336%"] - *3* [hive操作(行转列列转行)](https://blog.csdn.net/aiduo3346/article/details/102085019)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 33.333333333333336%"] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值