1、数据同步方案设计

本文探讨了数据同步的两大问题:存量与增量同步,并详细介绍了传统数据同步方案(如基于查询的CDC)及其存在的问题,以及大数据时代基于日志的CDC(如MySQL binlog)的优势。还列举了如Flink CDC、FlinkX、Canal等开源工具,并讨论了MQ中间件如RabbitMQ、Kafka、Pulsar在数据同步中的角色。最终,提出了采用Flink CDC与Pulsar结合的高效率、低延迟、批流一体的同步方案。
摘要由CSDN通过智能技术生成

        数据同步要解决2个问题,1是存量数据同步,2是增是数据同步。存量同步只需要进行一次,所以又叫离线同步,或批处理同步。增量同步要解决每时每刻的数据变化同步,要运行多次,所以又叫实时同步,流处理同步。

        数据准实时复制(CDC)是目前数据同步中大量使用的技术,随着国产化的需求,许多公司也逐步考虑基于开源产品进行准实时数据同步工具的相关开发,逐步实现对商业产品的替代。目前业界主流的实现机制可以分为两种:

        (1)基于查询的 CDC,详一、传统的数据同步方案:

        ◆离线调度查询作业,批处理。把一张表同步到其他系统,每次通过查询去获取表中最新的数据;

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

vandh

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值