Hive中collect相关的函数有collect_list和collect_set。
它们都是将分组中的某列转为一个数组返回,不同的是collect_list不去重而collect_set去重。
select concat_ws(',',collect_list(event)) as connection ,user_id,rank from mds_user_growth_user_path_1 group by user_id,rank
Hive中collect相关的函数有collect_list和collect_set。
它们都是将分组中的某列转为一个数组返回,不同的是collect_list不去重而collect_set去重。
select concat_ws(',',collect_list(event)) as connection ,user_id,rank from mds_user_growth_user_path_1 group by user_id,rank