文章目录 拉链表回顾 采集实现步骤 文字描述 拉链表回顾 拉链表就是之前我们讲过的SCD2,它的优点是即满足了反应数据的历史状态,又能在最大程度上节省存储。 拉链表的实现需要在原始字段基础上增加两个新字段: start_time(表示该条记录的生命周期开始时间——周期快照时的状态) end_time(该条记录的生命周期结束时间) 采集实现步骤 1.建立增量数据临时表update; 2.抽取昨日增量数据(新增和更新)到update表; 3.建立合并数据临时表tmp; 4.合并