FlinkCDC数据同步Bug——同步性能由于写入并行度限制无法提升问题的解决

项目场景:

项目为数据同步工具FlinkCDC性能压测,压测过程中发现无论是使用MySQLCDC Connector还是MongoDBCDC Connector,或者使用Flink1.13或者flink1.16版本,均会出现“增量同步阶段写入并行度强制为1”的问题,导致虽然默认并行度给到很高,但是由于只有一个subtask在写入,因此性能无法继续提升的问题。


问题描述

增量同步阶段写入并行度强制为1,全量同步阶段并行度无影响。

CDC测试代码如下:

#创建flink yarn-seesion集群
/opt/module/flink-1.13.6/bin/yarn-session.sh -nm flinkcdc_poc -d -s 8 -jm 2g -tm 2g

#启动sql-client
#引入各种CDC Connector和Sink Connector的jar
/opt/module/flink-1.13.6/bin/sql-client.sh embedded -s yarn-session -yid application_1682239076448_0001 -j /opt/module/flink-1.13.6/lib/flink-sql-connector-mysql-cdc-2.2.1.jar -j /opt/module/flink-1.13.6/lib/mysql-connector-java-5.1.47.jar -j /opt/module/flink-1.13.6/lib/flink-connector-jdbc_2.11-1.13.0.jar -j /opt/module/flink-1.13.6/lib/flink-sql-connector-mongodb-cdc-2.2.1.jar -j /opt/module/flink-1.13.6/lib/flink-sql-connector-sqlserver-cdc-2.2.1.jar -j /opt/module/flink-1.13.6/lib/flink-connector-clickhouse-1.13.2-SNAPSHOT.jar

#设置基础环境信息
set 'parallelism.default' = '8';
set 'execution.checkpointing.interval' = '3s';
set execution.checkpointing.tolerable-failed-checkpoints = 20;
set 'table.local-time-zone' = 'Asia/Shanghai';
set 'table.dynamic-table-options.enabled' = 'true';
set 'pipeline.operator-chaining'='false';

#创建Source Table
CREATE TABLE sbtest1_source (
  `id` int,
  `k` int,
  `c` char(120),
  `pad` char(60),
  PRIMARY KEY (`id`) NOT ENFORCED
) WITH (
  'connector' = 'mysql-cdc',
  'hostname' = 'XXXXXX',
  'port' = '3306',
  'username' = 'XXXXXX',
  'password' = 'XXXXXX',
  'server-time-zone' = 'Asia/Shanghai',
  'database-name' = 'sysbench',
  'table-name' = 'sbtest1'
);

#创建Sink Table
CREATE TABLE `sbtest1_sink` (
  `id` int,
  `k` int,
  `c` char(120),
  `pad` char(60),
  PRIMARY KEY (`id`) NOT ENFORCED
) WITH (
    'connector' = 'jdbc',
    'url' = 'jdbc:mysql://XXXXXX:3306/sysbench_sink?useSSL=false&autoReconnect=true'
    'driver' = 'com.mysql.cj.jdbc.Driver',
    'table-name' = 'sbtest1',
    'username' = 'XXXXXX',
    'password' = 'XXXXXX',
    'lookup.cache.max-rows' = '3000',
    'lookup.cache.ttl' = '10s',
    'lookup.max-retries' = '3',
    'sink.parallelism' = '8'
);

insert into sbtest1_sink(id,k,c,pad) select id,k,c,pad from sbtest1_source;


原因分析:

binlog读取由于内部Debezium插件要保证binlog的顺序只有一个并行度处理,而且source与sink的并行度一致,因此分区策略为forward,下游sink也相应地只有一个并行度。


解决方案:

1.  如果在全量数据比较少的情况下( 在1C2G的规格下,单线程可在分钟级别同步完成千万级别的表),考虑将source读取的并行度设为1, sink的并行度按需设置即可

2.  如果在全量数据较多的情况下,考虑将source读取的并行度设一个小于sink并行度的值即可(更改sink.parallelism)。

参考链接:https://blog.51cto.com/u_15127651/3800041

  • 2
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
严重bug问题分析与解决是软件开发过程中常见的一个环节。下面给出一个简单的步骤来解决严重bug问题: 1. 分析问题:首先要了解bug的现象和影响,尽可能详细地收集相关信息,例如错误日志、操作记录等。同时要尽可能复现问题,对于复现不了的问题,可以考虑与用户或者测试人员沟通,以获得更多相关信息。 2. 查找原因:在分析问题的基础上,可以开始查找导致bug发生的原因。这个过程可以使用多种调试工具和技术,例如断点调试、日志追踪、回归测试等。 3. 解决bug:一旦找到了问题的原因,就可以着手解决bug。这个过程包括修正代码,重新编译并进行测试。修复代码时要注意不要引入新的问题,同时要保持代码的可读性和可维护性。 4. 测试和确认:修复代码后,要进行充分的测试,确保问题已经被解决,并且没有引入新的问题。测试可以采用自动化测试和人工测试相结合的方式。同时,可以请相关人员进行确认,确保问题真正得到解决。 5. 部署和发布:一旦bug被完全解决,可以将新的代码部署到生产环境中。在部署前,要进行必要的备份,并进行充分的测试,以确保系统在生产环境中的稳定性和可用性。 在解决严重bug的过程中,及时沟通和合作是非常重要的。开发人员、测试人员和用户之间的沟通可以帮助更好地理解问题解决问题。同时,要及时记录和整理解决bug的过程和经验,以便在以后的开发过程中能够更好地应对类似的问题

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值