拉链表是数据仓库中的一个概念
一般来说数据仓库可能每日同步一些维表到数据仓库中,如果每日都是全量同步,对数据存储必定是巨大的浪费。维表的变化大都是比较缓慢的,拉链表为每一条记录提出了有效时间的概念,即一条记录的有效期“开始时间”和“结束时间”,只有变化的数据才会产生新的记录。下面是拉链表的一些关键节点
- 记录开始时间是记录的创建/修改时间。
- 结束时间为,如果记录没有变化过通常会用一个很大的时间作为结束时间,比如3099-12-31;如果记录修改过,就修改老记录并且加一条新记录,老记录把修改时间作为有效期结束时间,再添加一条新记录,结束时间为未来时间。
- 取数据只要圈定范围就可以取到对应时间内有效的数据。