ETL拉链算法简介

1.拉链表时针对数据仓库设计中表存储数据的方式而定义的,即记录历史,记录一个事务从开始,一直到当
前状态的所有变化的信息;

2.拉链表的数据可分为:保持不变的数据,Insert的数据,Delete的数据,Updated的数据;
拉链表的操作可分为:无变化,新开链以结束日期为最大日期(有效日期),关链(结束日期为当天),拉链(一关一开);

3.拉链数据的存储方式:快照存储,除表本身数据外,新增数据日期(开始);拉链存储,除表本身数据外,新增开始日期(开链)和结束日期(关链);

4.新增拉链数据:即主键新增,直接开链,新增开始日期和结束日期;

5.删除拉链数据:即数据删除,直接关链,将结束日期改为当天;

6.修改拉链数据:即属性字段的更新,先关链,再开链,将结束日期改为当天,再修改数据;

7.拉链数据的意义:节约存储空间,记录数据变化;

8.拉链算法的算法流程:建立临时表VT_NEW用于存放转换、处理后的数据;建立临时表VT_INC,用于存放比对出的增量数据;修改目标表,进行关链更新操作,修改目标表,进行开链插入操作;
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值