对于分库(垂直分割,根据业务分库)数据如何确保数据最终一致性,这里说明一下为什么进行数据同步,而不是通过服务调用获取。这里主要是对应于公共的数据信息,比如(人员,组织等)关联的数据多,查询量大通过本地数据库保存一份的方法来降低全局数据库的压力,提高查询效率。
实现的方法有如下几种:
1.直接查询变动数据同步
写一个定时任务扫描要同步的表数据,当有数据变动或增加数据时,立即向其他子系统数据库同步数据,并依次提交事物。
这种方式的好处是简单易实现;
缺点是如果同步过程中发生异常某个数据库数据回滚,其他数据库成功,会造成数据的不一致性。
实时扫描业务表数据对真实需要业务查询功能产生影响。
2.异步处理法
在全局数据库增加一个增量数据表,存放有变动的表名,数据id,变更时间,是否同步标识和回执 。
定时任务实时扫描增量表,根据时间对数据进行count操作,当count数值增加时,查询未同步标识的数据进行同步操作;
当变更时间超过5分钟仍没有返回值时再次进行通过操作,为避免同一条数据多次变更,最新的操作成功,而老的数据再次同步覆盖掉最新的数据,需要对同条数据count>1的数据全部标记为未同步,按照时间顺序进行再次同步。count=1的数据直接再次同步;
有同步返回标示的是同步成功的,这样就保证了同步数据一定能够成功;
3.消息确认法
由于前面方法2存在延迟较大,针对方法2的改进引入消息机制,就是在全局表进行同步时向消息队列写一条数据,子系统接收处理完消息后也向消息队列写一条消息。
消费端订阅此消息当收到两个一样的数据id消息时,表名次数据同步成功,如果没有收到两个一样id的消息时,说明此消息同步失败,需要再次同步。