canal消耗内存_阿里巴巴Canal常见问题:重复解析/Filter失效/消费落后

本文介绍了使用阿里巴巴开源数据库Binlog解析框架Canal时遇到的三大问题及其解决方案:1) Binlog解析错误,如DML解析为QUERY,主要由于非ROW模式的Binlog导致;2) Filter失效可能由于非ROW模式的Binlog或客户端subscribe设置;3) 消费落后可能因单机消费模式下内存缓冲区满导致。建议将消息写入消息队列以缓解消费压力。
摘要由CSDN通过智能技术生成

前言

Canal是阿里巴巴开源的数据库Binlog日志解析框架,主要用途是基于 MySQL 数据库增量日志解析,提供增量数据订阅和消费。

在之前我写的文章阿里开源MySQL中间件Canal快速入门中,我已经介绍了Canal的基本原理和基础使用。

在部署到生产环境的过程中,自己作为一个菜鸟,又踩了一些坑,期间做了记录和总结,并再解决后分析了下原因,便有了此文。

本文重点内容

Canal常见的三大问题原因分析及解决方案

Binlog解析错误:重复解析/DML解析为QUERY

Filter失效:设置过滤器无效

消费落后:消费延迟或卡死

Canal踩坑与原因分析

问题:Binlog解析错误 重复解析/DML解析为QUERY

这个问题主要由以下几种典型情况:

INSERT/UPDATE/DELETE被解析为Query或DDL语句

Binlog重复解析,即一个操作又有QUERY消息,又有对应的INSERT/UPDATE/DELETE消息。

这两个问题主要都是因为Binlog不是row模式导致的,先来复习下Binlog的三种模式。

复习 MySQL Binlog的三种运行模式

MySQL在进行主从同步时,会使用Binlog,从库读取Binlog来进行数据的同步。但是Binlog是有三种不同的运行模式的,分别是ROW模式、Statement模式和Mix模式。

1. ROW模式

Binlog日志中仅记录哪一条记录被修改了,修改成什么样了,会非常清楚的记录下每一行数据修改的细节,Master修改了哪些行,slave也直接修改对应行的数据

优点:row的日志内容会非常清楚的记录下每一行数据修改的细节,非常容易理解。而且不会出现某些特定情况下的存储过程和function,以及trigger的调用和出发无法被正确复制问题。

缺点:在row模式下,所有的执行的语句当记录到日志中的时候,都将以每行记录的修改来记录,这样可能会产生大量的日志内容。

2. Statement模式

每一条会修改数据的sql都会记录到master的binlog中,slave在复制的时候sql进程会解析成和原来master端执行相同的sql再执行。

优点:在statement模式下首先就是解决了row模式的缺点,不需要记录每一行数据的变化减少了binlog日志量,节省了I/O以及存储资源,提高性能。因为他只需要记录在master上所执行的语句的细节以及执行语句的上下文信息。

缺点:在statement模式下,由于他是记录的执行语句,所以,为了让这些语句在

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值