canal消耗内存_开源实战 | Canal生产环境常见问题总结与分析

本文总结了Canal在生产环境中遇到的三大问题:Binlog解析错误(如重复解析和DML解析为QUERY)、Filter设置失效以及消费滞后。分析了MySQL Binlog的ROW、Statement和Mix模式对Canal的影响,以及解决这些问题的方法,如调整Binlog模式、检查filter配置和考虑引入消息队列以缓解消费压力。
摘要由CSDN通过智能技术生成

前言

Canal是阿里巴巴开源的数据库Binlog日志解析框架,主要用途是基于 MySQL 数据库增量日志解析,提供增量数据订阅和消费。

在之前我写的文章阿里开源MySQL中间件Canal快速入门中,我已经介绍了Canal的基本原理和基础使用。

在部署到生产环境的过程中,自己作为一个菜鸟,又踩了一些坑,期间做了记录和总结,并再解决后分析了下原因,便有了此文。

本文重点内容

Canal常见的三大问题原因分析及解决方案

Binlog解析错误:重复解析/DML解析为QUERY

Filter失效:设置过滤器无效

消费落后:消费延迟或卡死

Canal踩坑与原因分析

问题:Binlog解析错误 重复解析/DML解析为QUERY

这个问题主要由以下几种典型情况:

INSERT/UPDATE/DELETE被解析为Query或DDL语句

Binlog重复解析,即一个操作又有QUERY消息,又有对应的INSERT/UPDATE/DELETE消息。

这两个问题主要都是因为Binlog不是row模式导致的,先来复习下Binlog的三种模式。

复习 MySQL Binlog的三种运行模式

MySQL在进行主从同步时,会使用Binlog,从库读取Binlog来进行数据的同步。但是Binlog是有三种不同的运行模式的,分别是ROW模式、Statement模式和Mix模式。

「1. ROW模式」

Binlog日志中仅记录哪一条记录被修改了,修改成什么样了,会非常清楚的记录下每一行数据修改的细节,「Master修改了哪些行,slave也直接修改对应行的数据」

优点:row的日志内容会非常清楚的记录下每一行数据修改的细节,非常容易理解。而且不会出现某些特定情况下的存储过程和function,以及trigger的调用和出发无法被正确复制问题。

缺点:在row模式下,所有的执行的语句当记录到日志中的时候,都将以每行记录的修改来记录,这样可能会产生大量的日志内容。

「2. Statement模式」

每一条会修改数据的sql都会记录到master的binlog中,「slave在复制的时候sql进程会解析成和原来master端执行相同的sql再执行。」

优点:在statement模式下首先就是解决了row模式的缺点,不需要记录每一行数据的变化减少了binlog日志量,节省了I/O以及存储资源,提高性能。因为他只需要记录在master上所执行的语句的细节以及执行语句的上下文信息。

缺点:在statement模式下,由于他是记录的执行语句,所以,为了让这些语句在slave端也能正确执行,那么他还必须记录每条语句在执行的时候的一些相关信息&

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值