再聊canal的FlatMessage和事务之间的关系

文章探讨了canal中的FlatMessageid与数据库事务的关系,指出id并不直接对应事务唯一标识,而是表示数据集合,同一id的数据可能来自不同事务。作者通过比喻和源码分析解释了FlatMessage的数据结构和其id的含义。
摘要由CSDN通过智能技术生成

背景

近期得益于项目上的技改推动,我对canal又有了进一步的认识。

最开始我以为flatMassage的id代表的是binlog的唯一id,随着对canal的使用深度不断加深,我逐渐认识到原先认为的是错误的。

你是否有过这样的疑问:

  • 事务与FlatMessage的id是什么关系?
  • 不同事务的FlatMessage的id肯定不一样吗?

数据库事务是指一系列数据库操作或查询,它们被看作一个不可分割的工作单元。在这个过程中,要么所有的操作都成功执行,要么在发生错误时,所有的操作都要回滚到事务开始前的状态。数据库事务可以确保数据的一致性和有效性,因为它们允许多个用户同时访问同一数据库,并且保证任何时候都不会出现数据被部分修改或删除的情况。同时,事务还拥有原子性、一致性、隔离性、持久性这四个特性,被称为ACID(原子性、一致性、隔离性、持久性)属性。

关于FlatMessage的id

[danger] 做个比喻,大家可能会更好理解。如果把FlatMessage比作日记本里的日记,那么id代表的是写满日记的纸张的页码。

以下是我总结的一些结论。详细过程涉及到敏感数据,过程就不演示了,大家可以验证以下我的结论。当然,最好的方式还是看源码,能够来得更直接。

  1. FlatMessage是canal发送给消息中间件时的一个数据结构。
public class FlatMessage implements Serializable {
    private static final long serialVersionUID = -3386650678735860050L;
    private long id;
    private String database;
    private String table;
    private List<String> pkNames;
    private Boolean isDdl;
    private String type;
    private Long es;
    private Long ts;
    private String sql;
    private Map<String, Integer> sqlType;
    private Map<String, String> mysqlType;
    private List<Map<String, String>> data;
    private List<Map<String, String>> old;
}
  1. FlatMessage中的一行数据是对同一个表、同类操作(UPDATEINSERTDELETE)的数据集合。
  2. FlatMessage关联的数据大小有上限的,即FlatMessage不会把同一个事务中的数据都放到同一条消息中。
  3. id相同的数据,不一定来自于同一个事务;正如一张纸写的不一定是同一天的日记。
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
如果您使用的是 Canal 1.x 版本,可以按照以下步骤配置 Canal 支持事务: 1. 在 Canal Server 的配置文件 `conf/canal.properties` 中,配置 `canal.instance.enableDdlSync=true`,表示开启 DDL 同步功能。 2. 在 Canal Client 的配置文件 `conf/example/instance.properties` 中,配置 `canal.instance.filter.regex=.*`,表示同步所有的表。 3. 在 Canal Client 的配置文件 `conf/example/instance.properties` 中,配置 `canal.instance.transactionSize=1000`,表示每次事务同步的最大条数为 1000。 4. 在 Canal Client 的启动代码中,使用 `CanalConnector` 的 `connect()` 方法建立连接,并使用 `subscribe()` 方法订阅需要同步的数据库和表。 5. 在 Canal Client 的启动代码中,使用 `start()` 方法启动监听,然后使用 `while` 循环不断读取数据,直到程序停止。 如果您使用的是 Canal 2.x 版本,可以按照以下步骤配置 Canal 支持事务: 1. 在 Canal Server 的配置文件 `conf/canal.properties` 中,配置 `canal.instance.enableDdlSync=true`,表示开启 DDL 同步功能。 2. 在 Canal Client 的配置文件 `conf/canal.yaml` 中,配置 `destination: example`,表示指定同步的目标为 `example`。 3. 在 Canal Client 的配置文件 `conf/canal.yaml` 中,配置 `filter: .*`,表示同步所有的表。 4. 在 Canal Client 的配置文件 `conf/canal.yaml` 中,配置 `group: example`,表示使用 `example` 分组。 5. 在 Canal Client 的启动代码中,使用 `CanalConnector` 的 `connect()` 方法建立连接,并使用 `subscribe()` 方法订阅需要同步的数据库和表。 6. 在 Canal Client 的启动代码中,使用 `start()` 方法启动监听,然后使用 `while` 循环不断读取数据,直到程序停止。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

子涵先生

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值