目录
0 需求分析
业务中涉及到学生退费的统计问题,求截止当前月退费总人数【退费人数:上月存在,这月不存在的学生个数】。
数据如下:
hive> select * from stu;
OK
2020-01-02 1001
2020-01-02 1002
2020-02-02 1001
2020-02-02 1002
2020-02-02 1003
2020-02-02 1004
2020-03-02 1001
2020-03-02 1002
2020-04-02 1005
2020-05-02 1006
Time taken: 0.487 seconds, Fetched: 10 row(s)
1 数据准备
(1)建表
create table stu
(
day string ,--'日期',
stu_id int -- '学生id'
)row format delimited fields terminated by '\t';
(2) 数据</