1、什么是CDC?
CDC 是 Change Data Capture(变更数据获取)的简称。在广义的概念上,只要能捕获数据变更的技术,我们都可以称为 CDC 。通常我们说的 CDC 技术主要面向数据库的变更,是一种用于捕获数据库中数据变更的技术。核心思想是,监测并捕获数据库的变动(包括数据或数据表的插入、更新以及删除等),将这些变更按发生的顺序完整记录下来,写入到消息中间件中以供其他服务进行订阅及消费。
2、CDC技术应用场景?
(1)、数据同步:用于备份,容灾(如mysql主从,不同服务器之前的数据同步)
(2)、数据分发:一个数据源分发给多个下游(如多个业务方需要使用同一份数据)
(3)、数据采集:面向数据仓库/数据湖的 ETL 数据集成(如采集业务数据库数据到数仓)
3、CDC种类?
(1)、基于查询的CDC:每次同步获取数据采用
本文介绍了Change Data Capture(CDC)的基本概念,包括其在数据同步、分发和采集中的应用。重点讲述了基于日志的CDC,如Flink CDC Connectors,它整合了Debezium,提供了数据一致性与实时性的保障。Flink CDC的优势在于简化了数据处理流程,无需额外部署数据同步组件或维护Kafka集群,降低了维护成本,同时简化了编码过程。
订阅专栏 解锁全文
282

被折叠的 条评论
为什么被折叠?



