canal 投递数据只进kafka 0分区

最新推荐文章于 2023-07-31 15:39:55 发布

不想做咸鱼的王富贵

最新推荐文章于 2023-07-31 15:39:55 发布

阅读量664

点赞数

分类专栏： debezium

本文链接：https://blog.csdn.net/weixin_43564627/article/details/118960534

版权

debezium 专栏收录该内容

17 篇文章 9 订阅

订阅专栏

本文详细介绍了Canal在将数据投递到Kafka时的分区策略，包括单topic单分区、多分区等场景，以及如何通过配置实现数据的顺序性和负载均衡。强调了canal.mq.partitionHash配置对数据路由的影响，并提供了多个配置示例，以确保不同业务需求下的数据顺序性和性能。同时，提到了热点表分区问题以及PK变更可能带来的顺序性挑战。

摘要由CSDN通过智能技术生成

canal 投递数据只进kafka 0分区

首先要确保其余kafka 有多个分区

在 instance.properties 加入以下配置即可二者缺一不可
在这里插入图片描述

下面一段摘至官网：

mq顺序性问题

1.canal目前选择支持的kafka/rocketmq，本质上都是基于本地文件的方式来支持了分区级的顺序消息的能力，也就是binlog写入mq是可以有一些顺序性保障，这个取决于用户的一些参数选择

2.canal支持MQ数据的几种路由方式：单topic单分区，单topic多分区、多topic单分区、多topic多分区
canal.mq.dynamicTopic，主要控制是否是单topic还是多topic，针对命中条件的表可以发到表名对应的topic、库名对应的topic、默认topic name
canal.mq.partitionsNum、canal.mq.partitionHash，主要控制是否多分区以及分区的partition的路由计算，针对命中条件的可以做到按表级做分区、pk级做分区等

3.canal的消费顺序性，主要取决于描述2中的路由选择，举例说明：
单topic单分区，可以严格保证和binlog一样的顺序性，缺点就是性能比较慢，单分区的性能写入大概在2~3k的TPS
多topic单分区，可以保证表级别的顺序性，一张表或者一个库的所有数据都写入到一个topic的单分区中，可以保证有序性，针对热点表也存在写入分区的性能问题
单topic、多topic的多分区，如果用户选择的是指定table的方式，那和第二部分一样，保障的是表级别的顺序性(存在热点表写入分区的性能问题)，如果用户选择的是指定pk hash的方式，那只能保障的是一个pk的多次binlog顺序性 ** pk hash的方式需要业务权衡，这里性能会最好，但如果业务上有pk变更或者对多pk数据有顺序性依赖，就会产生业务处理错乱的情况. 如果有pk变更，pk变更前和变更后的值会落在不同的分区里，业务消费就会有先后顺序的问题，需要注意


canal.mq.partitionHash 表达式说明
canal 1.1.3版本之后, 支持配置格式：schema.table:pk1^pk2，多个配置之间使用逗号分隔

例子1：test\\.test:pk1^pk2 指定匹配的单表，对应的hash字段为pk1 + pk2
例子2：.*\\..*:id 正则匹配，指定所有正则匹配的表对应的hash字段为id
例子3：.*\\..*:$pk$ 正则匹配，指定所有正则匹配的表对应的hash字段为表主键(自动查找)
例子4: 匹配规则啥都不写，则默认发到0这个partition上
例子5：.*\\..* ，不指定pk信息的正则匹配，将所有正则匹配的表,对应的hash字段为表名
按表hash: 一张表的所有数据可以发到同一个分区，不同表之间会做散列 (会有热点表分区过大问题)
例子6: test\\.test:id,.\\..* , 针对test的表按照id散列,其余的表按照table散列
注意：大家可以结合自己的业务需求，设置匹配规则，多条匹配规则之间是按照顺序进行匹配(命中一条规则就返回)

不想做咸鱼的王富贵

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
1
评论
canal 投递数据只进kafka 0分区

canal 投递数据只进kafka 0分区首先要确保其余kafka 有多个分区在 instance.properties 加入以下配置即可二者缺一不可下面一段摘至官网：mq顺序性问题1.canal目前选择支持的kafka/rocketmq，本质上都是基于本地文件的方式来支持了分区级的顺序消息的能力，也就是binlog写入mq是可以有一些顺序性保障，这个取决于用户的一些参数选择2.canal支持MQ数据的几种路由方式：单topic单分区，单topic多分区、多topic单分区、多topi
复制链接

扫一扫