SpringBoot整合Canal实现数据同步

一、开启数据库服务

1.1、检查Binlog日志是否开启

show variables like 'log_bin'

在这里插入图片描述

注意:如果Value=OFF,则需要开启Binlog日志,如果为ON时,则已开启。

1.2、开启Binlog日志

修改mysql的配置文件my.ini

在这里插入图片描述

注意:如果此路径下没有my.ini文件,则去C:\ProgramData\MySQL\MySQL Server 8.0路径下查找

server-id=1
# log-bin
log-bin = mysql-bin
# log-bin = C:\ProgramData\MySQL\MySQL Server 5.7\Data\log\bin_log
binlog_format = ROW
# binlog-do-db = canal-demo

server-id:配置MySQL replaction需要定义,不要和canal的slaveId重复
log-bin: binlog日志文件名称
binlog_format:binlog日志数据保存格式
binlog-do-db:指令同步的数据库,如果不指定则同步所有的数据库

在这里插入图片描述

重启MySQL服务:
关闭:net stop mysql57
启动:net start mysql57

1.3、常用Binlog日志查询

-- 查询Binlog是否开启
SHOW VARIABLES LIKE 'log_bin';
-- 查看Binlog日志文件列表
SHOW BINARY LOGS;
-- 查看当前正在写入的binlog文件
SHOW MASTER STATUS;

二、配置Canal

2.1 修改Canal配置文件:canal.properties

文件路径:canal.deployer-1.1.7\conf\canal.properties

canal.port = 11111

# tcp, kafka, rocketMQ, rabbitMQ, pulsarMQ
canal.serverMode = tcp

canal.destinations = example

canal.port:cannal的端口号,默认是11111
canal.serverMode:服务模式,tcp表示输入客户端,xxMQ输出到各种类型的消息中间件
canal.destinations:canal可以收集多个MySQL数据库数据,每个MySQL数据库都有独立的配置文件控制。具体配置规则:conf/目录下,使用文件夹放置,文件夹名代表一个MySQL实例。canal.destinations用于配置需要监控数据的数据库。如果是多个用逗号隔开(“,”),例如:canal.destinations = example, example1, example2

在这里插入图片描述
在这里插入图片描述

2.2 修改MySQL实例配置文件:instance.properties

文件路径:canal.deployer-1.1.7\conf\example\instance.properties
注意:因为MySQL实例配置文件可以有很多个,所以具体情况要看canal配置文件中的配置

# canal.instance.mysql.slaveId=0

canal.instance.master.address=127.0.0.1:3306

canal.instance.dbUsername=root
canal.instance.dbPassword=root

canal.instance.mysql.slaveId:使用canal从阶段ID,v1.0.26版本后会自动生成slaveId,所以可以不用配置
canal.instance.master.address:数据库的IP和端口
canal.instance.dbUsername:MySQL账号
canal.instance.dbPassword:MySQL密码

2.3 启动canal

文件路径:canal.deployer-1.1.7\bin

在这里插入图片描述

三、SpringBoot集成Canal

3.1 加载POM

<dependency>
    <groupId>top.javatool</groupId>
    <artifactId>canal-spring-boot-starter</artifactId>
    <version>1.2.1-RELEASE</version>
</dependency>

3.2 修改配置文件

在application.yml文件中增加以下配置

canal:
  server: 127.0.0.1:11111 #canal 默认端口11111
  destination: example
logging:  # 设置日志级别,否则会一致打印监听
  level:
    root: info
    top:
      javatool:
        canal:
          client:
            client:
              AbstractCanalClient: error

3.3 创建实例对象

package com.ming.domain;

import lombok.AllArgsConstructor;
import lombok.Builder;
import lombok.Data;
import lombok.NoArgsConstructor;

import java.io.Serializable;

@Data
@Builder
@NoArgsConstructor
@AllArgsConstructor
public class User implements Serializable {
    private Long id;
    private String name;
    private String phone;
}

3.4 编写拦截器

package com.ming.handler;

import com.ming.domain.User;
import lombok.extern.slf4j.Slf4j;
import org.springframework.stereotype.Component;
import top.javatool.canal.client.handler.EntryHandler;
import top.javatool.canal.client.annotation.CanalTable;

@Slf4j
@CanalTable("user")  // 数据库中的表名
@Component
public class UserCanalHandler implements EntryHandler<User> {
    @Override
    public void insert(User user) {
        log.info("insert message  {}", user);
    }

    @Override
    public void update(User before, User after) {
        log.info("update before {} ", before);
        log.info("update after {}", after);
    }

    @Override
    public void delete(User user) {
        log.info("delete  {}", user);
    }
}

四、Canal详解

4.1、Binlog的分类

分类介绍优点缺点
STATEMENT语句级别,保存的是对应的SQL语句,可能造成数据的不一致性,比如更新时间等节省空间可能造成数据的不一致性
ROW行级,记录变化的数据数据能够保存绝对一致占用空间大
MIXED兼顾STATEMENT和ROW的优点,很好,基本不用节省空间,兼顾数据一致性在智能转换的过程中,可能会出现意想不到的BUG

综上所述:如果想要对MySQL做数据分析的话,建议使用ROW模式

4.2、Canal的执行原理

  1. Canal将自己伪装成MySQL slave(MySQL的从库),向MySQL master(MySQL的主库)发送dump协议。
  2. MySQL master(MySQL的主库)收到dump协议,开始推送binary log给slave(即:canal)。
  3. Canal接收并解析Binlog日志,得到变更的数据,执行后续逻辑。

4.3、Canal的运用场景

  1. 数据库同步:同步数据到Redis等存储介质。
  2. 数据库实时监控:监控MySQL的更新操作,对于敏感信息可以及时通知相关人员。
  3. 数据分析和挖掘:将增量数据投递给Kafka等消息队列中,为数据分析和挖掘提供数据源。
  4. 数据库备份:将MySQL主库上数据增量日志复制到备库上,实现数据库备份。
  5. 数据集成:集成多个MySQL数据,为数据处理提供更加有效的解决方案。
  6. 数据库迁移:协助MySQL数据库的版本升级及数据迁移任务。

4.4、面试题

4.4.1 Canal是什么?有哪些特性

Canal是阿里巴巴开源的一款基于Netty实现的分布式、高性能、可靠的消息队列。在实现数据同步和数据分发场景下有着广泛的应用。
特性:
支持MySQL、Oracle等数据库的日志解析和订阅
支持多种数据输出方式,如:Kafka、RocketMQ、ActiveMQ等
支持数据过滤和格式转换
具有低延迟、高可靠性

4.4.2 Canal的工作原理

Canal主要是通过解析数据库的Binlog日志来获取数据库的增、删、改等操作,然后将变更事件发送给下游的消费者。
Canal的核心组件包括Client和Server两部分。
Client负责连接数据库,并启动日志解析工作,将解析出来的数据发送给Server。
Server负责接收Client发送的数据,并进行数据的过滤和分发。
Canal还支持多种数据输出器,如:Kafka、RocketMQ、ActiveMQ等,可以将解析出来的数据发送给不同的消息队列当中。

4.4.3 Canal的优缺点

优点:高性能、分布式、支持数据过滤和转换,跨数据库类型,比如MySQL、Oracle。
缺点:使用难度较大、对数据库日志产生一定影响,不支持数据回溯(即:无法获取历史数据)

4.4.4 Canal应用场景

Canal主要用于数据同步和数据分发场景。例如:数据备份、数据同步、数据实时分析、在线数据迁移

  • 4
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
Spring Boot是一个基于Java的开发框架,而Canal是一种用于增量数据订阅和消费的开源工具。在Spring Boot整合Canal可以方便地将数据库中的变更数据同步到其他系统中。 首先,我们需要在Spring Boot项目的pom.xml文件中添加Canal的依赖。然后,在application.properties配置文件中配置Canal的相关参数,包括Canal的服务地址、用户名、密码等。 接下来,在代码中可以通过编写监听器来实现对变更数据的订阅和消费。可以使用Canal提供的Java API来连接Canal服务,并注册事件监听器,监听数据库的变更事件。当有数据变更时,Canal会将相关的事件通知到监听器中。 在监听器中,可以获取到变更操作的数据库名、表名以及具体的变更数据。通过对这些数据的处理,可以实现将变更数据同步到其他系统中的逻辑。 例如,可以在监听器中使用Spring Boot的JdbcTemplate来向其他系统发送变更数据,或者将变更数据存储到缓存中,以供其他部分使用。 整合Canal的好处是可以实现数据的实时同步,将数据库中的变更数据推送到其他系统中,从而实现数据的实时更新和共享。同时,Canal提供了丰富的API和事件监听机制,可以满足不同场景下的需求,提供灵活的数据同步方案。 总之,通过Spring Boot整合Canal可以方便地将数据库的变更数据同步到其他系统中,实现数据的实时更新和共享。这为开发实时应用和数据集成提供了便利。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Monly21

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值