数仓项目拉链表详解

本文详细介绍了数据仓库中用于节省存储并记录历史状态的拉链表概念,包括其在应对数据变化、查询历史快照等方面的优势。通过具体示例展示了拉链表的结构和如何通过增量数据实现拉链表的更新过程。
摘要由CSDN通过智能技术生成

拉链表回顾

拉链表就是之前我们讲过的SCD2,它的优点是即满足了反应数据的历史状态,又能在最大程度上节省存储
拉链表的实现需要在原始字段基础上增加两个新字段

start_time(表示该条记录的生命周期开始时间——周期快照时的状态)
end_time(该条记录的生命周期结束时间)

在这里插入图片描述

采集实现步骤

1.建立增量数据临时表update
2.抽取昨日增量数据(新增和更新)到update表;
3.建立合并数据临时表tmp
4.合并昨日增量数据(update表)与历史数据(拉链表)
(1)新数据end_time设为’9999-12-31’,也就是当前有效;
(2)如果增量数

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

AIMaynor

觉得有用,要个免费的三连可有?

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值