这两个函数都是将分组数据的某列变成一个数组,不同的是collect_list是不去重,collect_set是去重
collect_set函数
1)创建原数据表
drop table if exists stud;
create table stud (name string, area string, course string, score int);
2)向原数据表中插入数据
insert into table stud values('zhang3','bj','math',88);
insert into table stud values('li4','bj','math',99);
insert into table stud values('wang5','sh','chinese',92);
insert into table stud values('zhao6','sh','chinese',54);
insert into table stud values('tian7','bj','chinese',91);
3)查询表中数据
select * from stud;
stud.name stud.area stud.course stud.score
zhang3 bj math 88
li4 bj math 99
wang5 sh chinese 92
zhao6 sh chinese 54