canal 安装和简单使用

注: 1. 该文章仅用于本人学习整理,如有错误还望谅解。
2.mysql并不是用docker启动

概述

canal是阿里巴巴旗下的一款开源项目,纯Java开发。基于数据库增量日志解析,提供增量数据订阅&消费,目前主要支持了MySQL(也支持mariaDB)。

起源:早期,阿里巴巴B2B公司因为存在杭州和美国双机房部署,存在跨机房同步的业务需求。不过早期的数据库同步业务,主要是基于trigger的方式获取增量变更,不过从2010年开始,阿里系公司开始逐步的尝试基于数据库的日志解析,获取增量变更进行同步,由此衍生出了增量订阅&消费的业务,从此开启了一段新纪元。

基于日志增量订阅&消费支持的业务:

  1. 数据库镜像
  2. 数据库实时备份
  3. 多级索引 (卖家和买家各自分库索引)
  4. search build
  5. 业务cache刷新
  6. 价格变化等重要业务消息

工作原理

mysql主备复制实现:
在这里插入图片描述
复制分成三步:

  1. master将改变记录到二进制日志(binary log)中(这些记录叫做二进制日志事件,binary log events,可以通过show binlog events进行查看);
  2. slave将master的binary log events拷贝到它的中继日志(relay log);
  3. slave重做中继日志中的事件,将改变反映它自己的数据。
    在这里插入图片描述
    原理相对比较简单:

1 . canal模拟mysql slave的交互协议,伪装自己为mysql slave,向mysql master发送dump协议

2 . mysql master收到dump请求,开始推送binary log给slave(也就是canal)

3 . canal解析binary log对象(原始为byte流).

安装canal之前先确认mysql是否开启binlog
登录到数据库中执行show variables like "%bin%";  查看日志是否打开,log_bin为OFF说明未开启。

在这里插入图片描述

安装canal

官网 : https://github.com/alibaba/canal/releases

在这里插入图片描述
解压后目录
在这里插入图片描述
进入canal/conf 目录
在这里插入图片描述
properties配置分为两部分:

  • canal.properties (系统根配置文件在canal/conf下)
  • instance.properties (instance级别的配置文件,每个instance一份)
  1. instance列表定义 (列出当前server上有多少个instance,每个instance的加载方式是spring/manager等)
  2. common参数定义,比如可以将instance.properties的公用参数,抽取放置到这里,这样每个instance启动的时候就可以共享. 【instance.properties配置定义优先级高于canal.properties】

instance.properties介绍:
a. 在canal.properties定义了canal.destinations后,需要在canal.conf.dir对应的目录下建立同名的文件

比如:

canal.destinations = example1,example2  #spring客户端注意指定的不同名字

这时需要创建example1和example2两个目录,每个目录里各自有一份instance.properties.
在这里插入图片描述
修改配置

vi conf/example/instance.properties

#################################################
## mysql serverId
canal.instance.mysql.slaveId = 1234
 
# position info
# 数据库地址
canal.instance.master.address = 172.16.0.76:3306
canal.instance.master.journal.name =  
canal.instance.master.position = 
canal.instance.master.timestamp = 
 
#canal.instance.standby.address = 
#canal.instance.standby.journal.name =
#canal.instance.standby.position = 
#canal.instance.standby.timestamp = 
 
# username/password
# mysql账号、密码、默认监控哪个库、字符集编码
canal.instance.dbUsername = canal
canal.instance.dbPassword = Tianjian2020
canal.instance.defaultDatabaseName = pytmfacer
canal.instance.connectionCharset = UTF-8
 
# table regex
#正则表达式匹配表
canal.instance.filter.regex = .*\\..*
# table black regex
canal.instance.filter.black.regex =  
 
#################################################

在mysql命令行,创建一个新用户,作为slave

CREATE USER canal IDENTIFIED BY 'canal';  
GRANT SELECT, REPLICATION SLAVE, REPLICATION CLIENT ON *.* TO 'canal'@'%';
-- GRANT ALL PRIVILEGES ON *.* TO 'canal'@'%' ;
FLUSH PRIVILEGES;

会生成对应的canal用户
在这里插入图片描述
执行bin目录下的startup.sh

启动后可以在logs目录下查看日志。在example目录下的example.log,如果没有报错,说明启动成功。

canal客户端编写

  1. 官方提供的:

服务端启动完毕后,在客户端即可监听test库的变化。

新建一个java maven项目,pom.xml里添加依赖

<dependency>
      <groupId>com.alibaba.otter</groupId>
      <artifactId>canal.client</artifactId>
      <version>1.0.12</version>
    </dependency>
package com.mindata;
 
import com.alibaba.otter.canal.client.CanalConnector;
import com.alibaba.otter.canal.client.CanalConnectors;
import com.alibaba.otter.canal.common.utils.AddressUtils;
import com.alibaba.otter.canal.protocol.CanalEntry;
import com.alibaba.otter.canal.protocol.Message;
 
import java.net.InetSocketAddress;
import java.util.List;
 
/**
 * A Camel Application
 * 官方提供
 */
public class MainApp {
 
    /**
     * A main() so we can easily run these routing rules in our IDE
     */
    public static void main(String... args) throws Exception {
 
        // 创建链接
        CanalConnector connector = CanalConnectors.newSingleConnector(new InetSocketAddress(“hostname”,
                11111), "example", "", "");
        int batchSize = 1000;
        int emptyCount = 0;
        try {
            connector.connect();
              /*
            如果修改了canal配置的instance文件 则不能使用connector.subscribe(".*\\..*")  会使配置文件失效
            // connector.subscribe(".*\\..*");
            如果 设置了canal.instance.filter.regex。 可以设置 connector.subscribe(); 不填写任何配置。
             */
            connector.subscribe(".*\\..*");
            connector.rollback();
            int totalEmptyCount = 120;
            while (emptyCount < totalEmptyCount) {
                Message message = connector.getWithoutAck(batchSize); // 获取指定数量的数据
                long batchId = message.getId();
                int size = message.getEntries().size();
                if (batchId == -1 || size == 0) {
                    emptyCount++;
                    System.out.println("empty count : " + emptyCount);
                    try {
                        Thread.sleep(1000);
                    } catch (InterruptedException e) {
                    }
                } else {
                    emptyCount = 0;
                    // System.out.printf("message[batchId=%s,size=%s] \n", batchId, size);
                    printEntry(message.getEntries());
                }
 
                connector.ack(batchId); // 提交确认
                // connector.rollback(batchId); // 处理失败, 回滚数据
            }
 
            System.out.println("empty too many times, exit");
        } finally {
            connector.disconnect();
        }
    }
 
    private static void printEntry(List<CanalEntry.Entry> entrys) {
        for (CanalEntry.Entry entry : entrys) {
            if (entry.getEntryType() == CanalEntry.EntryType.TRANSACTIONBEGIN || entry.getEntryType() == CanalEntry
                    .EntryType
                    .TRANSACTIONEND) {
                continue;
            }
 
            CanalEntry.RowChange rowChage = null;
            try {
                rowChage = CanalEntry.RowChange.parseFrom(entry.getStoreValue());
            } catch (Exception e) {
                throw new RuntimeException("ERROR ## parser of eromanga-event has an error , data:" + entry.toString(),
                        e);
            }
 
            CanalEntry.EventType eventType = rowChage.getEventType();
            System.out.println(String.format("================> binlog[%s:%s] , name[%s,%s] , eventType : %s",
                    entry.getHeader().getLogfileName(), entry.getHeader().getLogfileOffset(),
                    entry.getHeader().getSchemaName(), entry.getHeader().getTableName(),
                    eventType));
 
            for (CanalEntry.RowData rowData : rowChage.getRowDatasList()) {
                if (eventType == CanalEntry.EventType.DELETE) {
                    printColumn(rowData.getBeforeColumnsList());
                } else if (eventType == CanalEntry.EventType.INSERT) {
                    printColumn(rowData.getAfterColumnsList());
                } else {
                    System.out.println("-------> before");
                    printColumn(rowData.getBeforeColumnsList());
                    System.out.println("-------> after");
                    printColumn(rowData.getAfterColumnsList());
                }
            }
        }
    }
 
    private static void printColumn(List<CanalEntry.Column> columns) {
        for (CanalEntry.Column column : columns) {
            System.out.println(column.getName() + " : " + column.getValue() + "    update=" + column.getUpdated());
        }
    }
}

注意newSingleConnector那里,设置canal server的ip和端口,端口默认为11111。example是和conf目录下的相对应。

在这里插入图片描述
启动后,就可以打印empty count,此时你可以操作数据库里的test库,做任何增删改的操作,然后就能在控制台看到打印的语句

注: Message类:主要是id 和entries,rawEntries和raw(默认true)一般不去管这俩

message{id,Entry ,rawEntries,raw(默认true)} 大体这么个关系
在这里插入图片描述

Entry内部格式(entries子对象,entries的size和batchsize timeout有关)

1.Header
	version         [协议的版本号,default = 1]
	logfileName     [binlog文件名]
	logfileOffset   [binlog position]
	serverId        [服务端serverId]
	serverenCode    [变更数据的编码]
	executeTime     [变更数据的执行时间]
	sourceType      [变更数据的来源,default = MYSQL]
	schemaName      [变更数据的schemaname]
	tableName       [变更数据的tablename]
	eventLength     [每个event的长度]
	eventType       [insert/update/delete类型,default = UPDATE]
	gtid            [当前事务的gitd]
2.entryType         [事务头BEGIN/事务尾END/数据ROWDATA/HEARTBEAT/GTIDLOG]
3.storeValue        [byte数据,可展开,对应的类型为RowChange]    
	(RowChange)
	  tableId             [tableId,由数据库产生]
	  eventType           [数据变更类型,default = UPDATE]
	  isDdl               [标识是否是ddl语句,比如create table/drop table]
	  sql                 [ddl/query的sql语句]
	  ddlSchemaName       [ddl/query的schemaName,会存在跨库ddl,需要保留执行ddl的当前schemaName]
	  3.1rowDatas         [具体insert/update/delete的变更数据,可为多条,1个binlog event事件可对应多条变更,比如批处理]
			beforeColumns   [字段信息,增量数据(修改前,删除前),Column类型的数组]
			afterColumns    [字段信息,增量数据(修改后,新增后),Column类型的数组] 	
			  (Column)
				index          [字段下标]      
				sqlType        [jdbc type]
				name           [字段名称(忽略大小写),在mysql中是没有的]
				isKey          [是否为主键]
				updated        [是否发生过变更]
				isNull         [值是否为null]
				value          [字段值,timestamp,Datetime是一个时间格式的文本]
				length         [对应数据对象原始长度]
				mysqlType      [字段mysql类型]

由于时间太长忘记当时获取资料的连接,如盗用您连接的资料请谅解,如侵权请私信秒删

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值