数仓中表的种类及其概念
一般表分为两个类型:维度表和事务表
拉链表制作:
1.初始化:利用update_time作为dw_start_date,9999-12-31作为dw_end_date
2.更新历史数据:将业务mysql 中更新时间为当天的数据抽取到系统,然后将拉链表关联当天数据,将拉链表更新
如果是周期性事实表,相对于前面的拉链表,拉链表应该按天分区
第一次全量导入数据应该开启动态分区,根据create_time字段进行分区划分,同一天的订单放在同一分区。
更新历史数据拿一段时间的历史数据跟当天数据管理,更新历史拉链表
因为这样的表一般数据量过大,这样可以减少数据运算量,根据业务规则关联一段时间的数据