数据同步解决方案-canal

一、背景

早期,阿里巴巴B2B公司因为存在杭州和美国双机房部署,存在跨机房同步的业务需求。不过早期的数据库同步业务,主要是基于trigger的方式获取增量变更,不过从2010年开始,阿里系公司开始逐步的尝试基于数据库的日志解析,获取增量变更进行同步,由此衍生出了增量订阅&消费的业务,从此开启了一段新纪元。

ps. 目前内部版本已经支持mysql和oracle部分版本的日志解析,当前的canal开源版本支持5.7及以下的版本(阿里内部mysql 5.7.13, 5.6.10, mysql 5.5.18和5.1.40/48)

基于日志增量订阅&消费支持的业务:

  1. 数据库镜像
  2. 数据库实时备份
  3. 多级索引 (卖家和买家各自分库索引)
  4. search build
  5. 业务cache刷新
  6. 价格变化等重要业务消息

二、工作原理

mysql主从复制

 

从上层来看,复制分成三步:

  1. master将改变记录到二进制日志(binary log)中(这些记录叫做二进制日志事件,binary log events,可以通过show binlog events进行查看);
  2. slave将master的binary log events拷贝到它的中继日志(relay log);
  3. slave重做中继日志中的事件,将改变反映它自己的数据。

canal 原理

原理相对比较简单:

  1. canal模拟mysql slave的交互协议,伪装自己为mysql slave,向mysql master发送dump请求

  2. mysql master收到dump请求,开始推送binary log给canal

  3. canal解析binary log对象(原始为byte流)

三、环境部署

  1. 1.2.1 mysql开启binlog模式

    (1)查看当前mysql是否开启binlog模式。

    SHOW VARIABLES LIKE '%log_bin%'

    如果log_bin的值为OFF是未开启,为ON是已开启。

  2.  

    (2)修改/etc/my.cnf 需要开启binlog模式。

     

    [mysqld]
    log-bin=mysql-bin
    binlog-format=ROW
    server_id=1

    修改完成之后,重启mysqld的服务。

    (3) 进入mysql

    mysql -h localhost -u root -p

    (4)创建账号 用于测试使用

    使用root账号创建用户并授予权限

    create user canal@'%' IDENTIFIED by 'canal';
    GRANT SELECT, REPLICATION SLAVE, REPLICATION CLIENT,SUPER ON *.* TO 'canal'@'%';
    FLUSH PRIVILEGES;

    1.2.2 canal服务端安装配置

    (1)下载地址canal

    https://github.com/alibaba/canal/releases/tag/canal-1.0.24

     

     

    (3)修改 exmaple下的实例配置

    vi conf/example/instance.properties 
  3. 修改如图所示的几个参数。

    一定要注释掉下面这个参数,这样就会扫描全库

    #canal.instance.defaultDatabaseName =

    (3)启动服务:

    [root@localhost canal]# ./bin/startup.sh

    (4)查看日志:

    cat /usr/local/canal/logs/canal/canal.log

     

    这样就表示启动成功了。

    1.2.3 canal常见错误处理

    错误信息如下:

    2019-06-17 19:35:20.918 [New I/O server worker #1-2] ERROR c.a.otter.canal.server.netty.handler.SessionHandler - something goes wrong with channel:[id: 0x7f2e9be3, /192.168.200.56:52225 => /192.168.200.128:11111], exception=java.io.IOException: Connection reset by peer

    解决办法:

    进入mysql中执行下面语句查看binlog所在位置

    mysql> show master status;
    显示如下:
    +------------------+----------+--------------+------------------+-------------------+
    | File             | Position | Binlog_Do_DB | Binlog_Ignore_DB | Executed_Gtid_Set |
    +------------------+----------+--------------+------------------+-------------------+
    | mysql-bin.000001 |      120 |              |                  |                   |
    +------------------+----------+--------------+------------------+-------------------+
    1 row in set (0.00 sec)

    如果file中binlog文件不为 mysql-bin.000001 可以重置mysql

    mysql> reset master;

    查看canal配置文件

    vim usr/local/canal/conf/example/meta.dat

    找到对应的binlog信息更改一致即可, 或者删除这个meta.dat也可以.

    "journalName":"mysql-bin.000001","position":43581207,"

    1.3 数据监控微服务

    当用户执行数据库的操作的时候,binlog 日志会被canal捕获到,并解析出数据。我们就可以将解析出来的数据进行相应的逻辑处理。

    我们这里使用的一个开源的项目,它实现了springboot与canal的集成。比原生的canal更加优雅。

    https://github.com/chenqian56131/spring-boot-starter-canal

    使用前需要将starter-canal安装到本地仓库。

    我们可以参照它提供的canal-test,进行代码实现。

    (1)创建工程模块changgou_canal,pom引入依赖

    <dependency>
        <groupId>com.xpand</groupId>
        <artifactId>starter-canal</artifactId>
        <version>0.0.1-SNAPSHOT</version>
    </dependency>

    (2)创建包com.changgou.canal ,包下创建启动类

    @SpringBootApplication
    @EnableCanalClient
    public class CanalApplication {
    ​
        public static void main(String[] args) {
            SpringApplication.run(CanalApplication.class, args);
        }
    }

    (3)添加配置文件application.properties

    canal.client.instances.example.host=192.168.200.128
    canal.client.instances.example.port=11111
    canal.client.instances.example.batchSize=1000

    (4)创建com.changgou.canal.listener包,包下创建类

    @CanalEventListener
    public class BusinessListener {
    ​
        @ListenPoint(schema = "commodity", table = {"gs_brand_info"})
        public void adUpdate(CanalEntry.EventType eventType, CanalEntry.RowData rowData) {
            System.err.println("广告数据发生变化");
            rowData.getBeforeColumnsList().forEach((c) -> System.err.println("更改前数据: " + c.getName() + " :: " + c.getValue()));
            rowData.getAfterColumnsList().forEach((c) -> System.err.println("更改后数据: " + c.getName() + " :: " + c.getValue()));
        }
    }

    测试:启动数据监控微服务,修改commodity的gs_brand_info表,观察控制台输出。

  • 0
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值