结合TDSQL系统的特点,研究团队提出并实现了一个轻量且高效的全时态数据库系统,该系统可以在保留原有TDSQL强劲的OLTP处理性能的同时,通过巧妙的系统设计,提供了内建的时态数据管理能力。
存储
TDSQL全时态数据库系统创新性地采用了一种混合存储模式,来对时态数据进行管理。系统将时态数据拆分为当前数据和历史数据,针对不同的数据类型,分别采用不同的存储策略。当前数据管理模块,采用了基于MVCC(多版本并发访问控制协议)设计的数据库所普遍采用的段页式结构,并且专门开辟回滚段,来对更新或删除操作产生的旧版本进行暂存。在回滚段中暂存的数据会在数据库进行资源回收操作(如MySQL中的Purge和PostgreSQL中的VACUUM等)时,迁移到历史数据管理模块,这个过程被称为数据转储。这是一种异步的转储策略,因而几乎不会造成性能损耗。历史数据存储模块,通过k-v格式来进行组织,可以大幅度缩小存储开销。由于一个数据项会存在多个历史版本,而这些历史版本会在某些属性上存在一样的值,例如表一中的James被重复四次。因此,在历史数据存储模块中,系统将每一个版本转化为一条k-v,并且只存储相较于上一个版本发生变化的属性值。
查询与事务处理
系统对时态查询处理逻辑进行了针对性设计与优化。通过专门的时态查询编译器,部分时态查询条件(如有效时间查询)会被重写并拼接到WHERE条件中。而对于事务时间查询,系统将其查询条件转化为