简单理解什么是数据库CDC?(以mysql为例)

一、数据库CDC是什么

CDC 是change data capture,即变化数据捕捉。是数据库进行备份的一种方式,常用于大量数据的备份工作。分为入侵式的和非入侵式的备份方法,入侵式的有基于触发器备份、基于时间戳备份、基于快照备份,非入侵式的备份方法是基于日志的备份。mysql 基于日志的CDC就是要开启mysql binary log。

二、Mysql基于日志的CDC配置

1、查看mysql是否开启Binlog

show variables like 'log_bin';

若变量log_bin的值为“OFF”,则说明Binlog未开启,继续执行下一步。

若变量log_bin的值为“ON”,则说明Binlog已开启,继续执行以下SQL命令,检查相关参数的配置是否符合要求。

show variables like '%binlog_format%';
show variables like '%binlog_row_image%';

变量binlog_format的值应该为“ROW”,变量binlog_row_image的值应该为“FULL”。

2、执行以下命令编辑MySQL配置文件,然后按“i”进入输入模式。

vi /etc/my.cnf

在配置文件中增加如下配置,开启Binlog。

server-id = 123
log_bin = mysql-bin
binlog_format = row
binlog_row_image = full
expire_logs_days = 10
gtid_mode = on
enforce_gtid_consistency = on

 

其中:

server-id的值应为大于1的整数,请根据实际规划设置,并且在创建数据集成任务时设置的“Server Id”值需要此处设置的值不同。
expire_logs_days为Binlog日志文件保留时间,超过保留时间的Binlog日志会被自动删除,应保留至少2天的日志文件。
“gtid_mode = on”和“enforce_gtid_consistency = on”仅当MySQL的版本大于等于5.6.5时才需要添加,否则删除这两行内容。

 

按“Esc”退出输入模式,然后输入“:wq”并回车,保存退出。
执行以下命令重启MySQL数据库。

service mysqld restart

以root用户登录数据库,执行以下命令,查询变量log_bin的值是否为“ON”,即是否已开启Binlog。

show variables like 'log_bin';

3、在数据库中执行以下命令创建ROMA连接数据库的用户并配置权限。

CREATE USER 'roma'@'%' IDENTIFIED BY 'password';
GRANT SELECT, RELOAD, SHOW DATABASES, REPLICATION SLAVE, REPLICATION CLIENT ON *.* TO 'roma'@'%';

 

其中:

roma为ROMA连接用户名,请根据实际规划设置。
password为ROMA连接用户密码,请根据实际规划设置。

数据库管理中,CDC(Change Data Capture)是一种有效的方法来实时监控和记录数据表的变更。对于MySQL数据库,触发器是一个重要的工具,可以用来捕获数据的插入(INSERT)和更新(UPDATE)操作。为了实现CDC功能,我们可以创建触发器来自动记录表的变更到另一个表中。 参考资源链接:[MYSQL CDC触发器实现详细步骤](https://wenku.csdn.net/doc/53ceq6i3uk?spm=1055.2569.3001.10343) 首先,我们需要确定监控的表,如`t_log_sr_info`,以及用于记录变更的表,比如`cdc_t_log_sr_info`。在`cdc_t_log_sr_info`表中,通常会包含原始表的所有字段,以及额外的字段来记录操作类型(如'insert'或'update')和变更的时间戳。 接下来,我们创建两个触发器,一个用于捕获插入操作,另一个用于捕获更新操作。以下是创建触发器的步骤: 1. 检查是否存在同名的触发器,如果存在则删除: ```sql DROP TRIGGER IF EXISTS trigger_log_sr_info_insert; DROP TRIGGER IF EXISTS trigger_log_sr_info_update; ``` 2. 使用`DELIMITER`更改语句结束符,以便能够定义多行触发器逻辑: ```sql DELIMITER | ``` 3. 创建捕获插入操作的触发器: ```sql CREATE TRIGGER trigger_log_sr_info_insert AFTER INSERT ON t_log_sr_info FOR EACH ROW BEGIN INSERT INTO cdc_t_log_sr_info (column1, column2, ..., operation, timestamp) VALUES (NEW.column1, NEW.column2, ..., 'insert', NOW()); END; | DELIMITER ; ``` 4. 创建捕获更新操作的触发器: ```sql CREATE TRIGGER trigger_log_sr_info_update AFTER UPDATE ON t_log_sr_info FOR EACH ROW BEGIN INSERT INTO cdc_t_log_sr_info (column1, column2, ..., operation, timestamp) VALUES (NEW.column1, NEW.column2, ..., 'update', NOW()); END; | DELIMITER ; ``` 在上述代码中,`column1`, `column2`, ... 应该替换为你实际的表字段名。`NEW.columnX`是MySQL中引用触发器操作后新插入或更新的行的值的语法。 通过这些触发器,每当`t_log_sr_info`表中有新的插入或更新操作时,相应的变更就会被记录到`cdc_t_log_sr_info`表中,从而实现了CDC功能。这在进行数据同步、构建数据仓库或进行实时分析时非常有用。 最后,值得注意的是,触发器在提高数据库操作透明性的同时,也可能会对性能产生影响,特别是在高并发的环境下。因此,在实施触发器之前,应当评估其对系统性能的影响,并在生产环境中进行充分的测试。 为了深入理解MySQL触发器以及CDC的实现,建议查看《MYSQL CDC触发器实现详细步骤》这份资源。该资源提供了详细的步骤和代码示,帮助你构建适合自身需求的CDC解决方案。 参考资源链接:[MYSQL CDC触发器实现详细步骤](https://wenku.csdn.net/doc/53ceq6i3uk?spm=1055.2569.3001.10343)
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值