本文主要介绍源表为单表时,增量数据同步的情况。当源表为多表时,后面的文章会继续介绍。
一、数据同步情况说明
将源数据库S中的A表(将此表称为源表),通过ETL工具同步至目标数据库T的A表(将此表称为目标表)。假设源表A的表结构与目标表A的表结构完全一致。表结构如下图所示:
采用时间戳的方式进行增量数据同步,需要目标数据库T中建立一张数据同步日志表LOG,来记录每次数据同步的情况。
表结构如下图所示:
其中,KSSJ、JSSJ字段为保存的值为源表A中每次数据同步时,根据ZHXGSJ字段进行数据过滤的字段值。
二、增量数据同步过程
1、结合源表的数据结构并确认源表的时间戳字段(在这里此字段名为ZHXGSJ,即最后修改时间)。注意,时间戳字段不能为空。若为空,则不能采用此方法进行数据同步。
2、单次增量数据同步流程图,如下图所示:
1)、开始。
2)、判断源表A中的数据记录数是否为0。即在源数据库S下执行下面语句: