常见的三种采集方案
-
直连同步
-
通过API和动态链接同步数据库数据,会对源数据库产生较大影响。不建议直接同步主数据库
-
-

-
数据文件同步
-
同步源系统生成的文本文件。
-
文本文件一般由单独的服务器存储
-
为了保证数据质量,处理源数据,还需要校验文件
-
-

-
-
数据库日志解析同步(一般采用此种方式)
-
通过同步、解析数据库日志文件系统进行数据同步。可以实现毫秒级延迟且对数据库影响小。
-
-

一般通过主键去重,按照时间更新顺序抽取最近一条数据。
按照是否保留删除数据,可分为三种方式:

本文介绍了数据库数据采集的三种方案:直连同步、数据文件同步和数据库日志解析同步。重点讲述了数据库日志解析同步,包括全量保留数据的方法,并讨论了数据同步的关键点、增量与全量同步的合并策略以及数据漂移问题的处理。阿里提出的解决方案是根据不同的时间戳冗余和过滤数据,确保数据准确性。
最低0.47元/天 解锁文章
1872

被折叠的 条评论
为什么被折叠?



