hive的collect_set

最新推荐文章于 2024-03-14 19:24:41 发布

大王go巡山

最新推荐文章于 2024-03-14 19:24:41 发布

阅读量4.9k

点赞数

分类专栏： hive学习文章标签： hive

本文链接：https://blog.csdn.net/qq_29425617/article/details/80836113

版权

16 篇文章 1 订阅

订阅专栏

concat_ws常和collect_set和group by结合起来一起用

collect_set去除重复元素；collect_list不去除重复元素

collect_set(col)函数只接受基本数据类型，它的主要作用是将某字段的值进行去重汇总，产生array类型字段

hive中常存在先通过group by对一字段去重后，还需要对另一字段也去重，这时候就需要collect_set（）

stu表

 
 ID
course
1
english
2
math
1
english
1
music
 

select 
ID,
COALESCE（concat_ws(',',collect_set(course))）course_name
FROM stu
Group by ID;

执行结果为

 
 id
course_name
1
english,music
2
math

id	course_name
1	english,music
2	math

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

关注关注