hive实现wm_concat()

首先还是先说下wm_concat的函数定义
wm_concat:通过id实现某个字段的拼接
举一个例子来更清楚的展示wm_concat的作用效果

例:
现有table: tmp
|id | name |
| 1 | yy   |
| 1 | yw   |
| 2 | tl   |
| 3 | lo   |
| 3 | ke   |
oracle sql:
select id,wm_concat(name) namet from tmp group by id
结果:
|id | namet |
| 1 | yy,yw |
| 2 | tl    |
| 3 | lo,ke |

这就是wm_concat()的大致作用所在,可是呢oracle官方倒是不建议使用wm_concat()。

知道了wm_concat()函数的作用那在hive中就懂得如何去实现了,
恰巧hive中刚好含有一个函数对应了wm_concat().
这个函数就是concat_set() 或者concat_list()

concat_set()会对结果去重
concat_list()不会去重
例:
现有table: tmp
|id | name |
| 1 | yy   |
| 1 | yw   |
| 2 | tl   |
| 2 | tl   |
| 3 | lo   |
| 3 | ke   |

hive sql
select id,concat_ws(',',collect_set(name)) namet from tmp group by id
结果:
|id | namet |
| 1 | yy,yw |
| 2 | tl    |
| 3 | lo,ke |

hive sql
select id,concat_ws(',',collect_list(name)) namet from tmp group by id
结果:
|id | namet |
| 1 | yy,yw |
| 2 | tl,tl |
| 3 | lo,ke |

其实呢,无论是wm_concat()还是collect_set() or collect_list()的目的都是将同一个id下的name处理成一行显示而已。
  • 2
    点赞
  • 15
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值