离线数仓常见问题

1. 数据漂移

ODS的表在同一个业务日期数据中包含前一天或者后一天凌晨附近的数据或者丢失当天的变更数据

2. 维度建模与ER建模

3. 缓慢变化维

维度的属性并不是静态的,它会随着时间的流失发生缓慢的变化

4. 退化维

5. 星形模型与雪花模型

6. 拉链表、流水表、全量表、增量表

  • 全量表:每天的所有的最新状态的数据,
  • 增量表:每天的新增数据,增量数据是上次导出之后的新数据。
  • 拉链表:维护历史状态,以及最新状态数据的一种表,拉链表根据拉链粒度的不同,实际上相当于快照,只不过做了优化,去除了一部分不变的记录而已,通过拉链表可以很方便的还原出拉链时点的客户记录。
  • 流水表: 对于表的每一个修改都会记录,可以用于反映实际记录的变更。 

7. 今天1点跑完昨天的数据,但昨天有些数据在今天3点才传过来

8. 昨天订单1000,今天有昨日订单退单的100单,如何让昨天订单刷为900

  • 0
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值