-
如果用户拉链表9999分区丢失了,怎么找回?
可以把ODS的用户增量表全部算一遍,不要分区条件(where),用user_id分组,取最大日期的数据,放到9999分区,就是最新的数据。 -
保证数据幂等性
只有ADS层的表,每次insert数据,都需要把之前的数据都查出来union,因为ADS层的表没有分区。 -
累积快照事实表
下单时间 支付时间 收货时间
9999分区只存状态没有完成的数据,目的是为了在查询状态没有完成的数据时,能直接查询出来,而不要加复杂的过滤条件。
关于离线数仓
最新推荐文章于 2024-07-28 23:55:21 发布