HIVE拉链表,一般会有dp和dt两个可以卡,拉链表每天存储的是每天新增及变化的数据,如果要获得历史至今的最新数据,卡dp=active
每日全量表,每天一份最新的完整数据,卡历史至今的一份全量数据,直接抽select MAX(dt) from table
每日增量表,每天保存的是一份新增的数据,要卡历史至今的数据,用dt<MAX(dt)
HIVE表拉链表全量表和增量表三种表获取历史至今的数据
最新推荐文章于 2023-06-21 08:56:21 发布
HIVE拉链表,一般会有dp和dt两个可以卡,拉链表每天存储的是每天新增及变化的数据,如果要获得历史至今的最新数据,卡dp=active
每日全量表,每天一份最新的完整数据,卡历史至今的一份全量数据,直接抽select MAX(dt) from table
每日增量表,每天保存的是一份新增的数据,要卡历史至今的数据,用dt<MAX(dt)