背景:数据从Oracle迁移到MySql(分库分表)且表结构有变动
架构:
步骤:
1、DataPipline采集存量和增量数据发送到Kafka
DataPipline先开启增量任务,在开启存量任务,为保证顺序性,kafka partion设置为1
2、由同步程序将Kafka数据消费进行逻辑处理后发送到MySql
先消费存量数据,在消费增量数据,做好幂等
3、控台用于推送ShardingSphere-Proxy分库分表规则及控制同步任务的启停
分库分表采用ShardingSphere-Proxy
结果:
因为表结构变动,同步程序处理有一定的逻辑,目前一个线程批量处理500条记录,每个线程一天同步1kw+条记录