canal实现同步mysql至es

目录

一、canal 简介

二、canal安装

1. 下载canal-deployer 

1.修改canal-deployer 配置文件

 2. canal-adapter配置及使用

 3. canal-admin

4. 运行测试阶段

 5. 坑总结


一、canal 简介

早期阿里巴巴因为杭州和美国双机房部署,存在跨机房同步的业务需求,实现方式主要是基于业务 trigger 获取增量变更。从 2010 年开始,业务逐步尝试数据库日志解析获取增量变更进行同步,由此衍生出了大量的数据库增量订阅和消费业务。

基于日志增量订阅和消费的业务包括

  • 数据库镜像
  • 数据库实时备份
  • 索引构建和实时维护(拆分异构索引、倒排索引等)
  • 业务 cache 刷新
  • 带业务逻辑的增量数据处理

当前的 canal 支持源端 MySQL 版本包括 5.1.x , 5.5.x , 5.6.x , 5.7.x , 8.0.x

二、canal安装

canal官方地址:https://github.com/alibaba/canal/releases

这边以1.1.5版本为例子:

首先需要先确定mysql bin-log日志是否启动。

开启bin-log日志,这边以docker为例子:

 docker ps #查看启动的容器
#进入容器
docker exec -it 容器ID /bin/bash    
#

进入mysql:

 

 这边已经开启

如果没开启新进入config

 cd etc/mysql/mysql.conf.d/

编写conf文件加入以下三行:

[mysqld]
log-bin=mysql-bin   #开启binlog
binlog-format=ROW   #选择row模式
server_id = 1      # 配置 MySQL replaction 需要定义,不要和 canal 的 slaveId 重复

保存退出容器。

重启:mysql     

docker restart 容器ID

准备工作完毕。

1. 下载canal-deployer 

 首先安装 canal服务端 : canal.deployer

解压deployer文件  : 

tar -zxvf canal.deployer-1.1.5.tar.gz

1.修改canal-deployer 配置文件

首先进入配置文件:官方默认指定example

为什么会自带有example 文件夹,请参考官网:AdminGuide · alibaba/canal Wiki (github.com)

cd /home/canal/canal-deployer/conf/example/

修改instance.properties 文件配置:

 进入bin文件 启动服务即可

./startup.sh    #启动服务


./stop.sh      #终止服务

日志出现这个启动成功:

 2. canal-adapter配置及使用

和之前服务端一样先下载解压,我的文件结构是这样,个人按照自己配置

 

 下面配置客户端文件

进入conf文件后   

vim application.yml    #编辑配置文件
 

没有vim可自行下载或者使用vi 。

删除其他对我们使用无用配置后如上图所示:

 

配置数据库数据源 ,这边库记得指定先去数据库建立该库,否则启动时候会报错

 大概配置如下:

坑如下:

1. hosts地址配置第三方地址的时候记得加上 http://

2. 记得先启动服务端再启动客户端,否则会报连接失败 11111端口

3. mode: 改成rest模式

4. 报错出现out of money内存不够的时候那是你服务器内存不够开启了

然后进入es7修改sql

mytest_user.yml 

我这边 只建立了一个user表,sql:指定一下

a.id as _id 这边注意是_  对应es那边索引id

_index:   对应es那边的 库名称

配置如上,完成后进入bin启动    ./startup.sh

下面我们去es建立索引

PUT /mytest_collect
{
  "mappings": {
    "properties": {
      "name": {
        "type": "text",
        "fields": {
          "keyword": {
            "type": "keyword"
          }
        }
      },
      "roleId": {
        "type": "long"
      },
      "time": {
        "type": "date"
      }
    }
  }
}

建立成功。

 3. canal-admin

属于面向运维的可视化界面。这里不做过多介绍,感兴趣的可以自己去了解。

4. 运行测试阶段

INSERT INTO `mytest`.`user`(`id`, `name`, `role_id`) VALUES (24, '1ddd', 88888)

测试下

发现es同步过来了。

 5. 坑总结

1. 

当出现这个日志的时候,但是没有出现 

 这个得时候,检查es 索引是否建立。或者检查服务端配置中连接es配置是否 正确,url或者账号密码。

2. 启动时出现异常

class com.alibaba.druid.pool.DruidDataSource  cannot be cast to  class com.alibaba.druid.pool.DruidDataSource 

 解决方案:

源码下载后将

官方源码地址: https://github.com/alibaba/canal/releases

修改client-adapter下escore的pom中druid包的scope为provided模式。

   <dependency>
      <groupId>com.alibaba</groupId>
      <artifactId>druid</artifactId>
      <scope>provided</scope> #新增 让es的xxxx-with-dependency.jar不包含druid相关包
   </dependency>

canal 源码: canal 1.1.5源码

这个路径下pom

我的 gitee里面有打包好的包,自行替换即可。

  • 3
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
实现MySQL数据实时同步到Elasticsearch可以使用Canal工具。 Canal是阿里巴巴开源的一套基于数据库增量日志解析的数据同步和逆向解析工具,可以实时获取数据库的变更日志,然后将这些变更日志解析成数据并发送到指定的目的地。在实现MySQL数据实时同步到Elasticsearch中,可以使用Canal实现以下步骤: 1. 安装配置Canal:首先,需要下载并安装Canal,并配置Canal的参数,如MySQL的地址、端口、用户名、密码等。 2. 创建Canal实例:根据实际需求,可以创建一个或多个Canal实例来监控和同步MySQL的变更日志。 3. 配置Elasticsearch目的地:配置Canal将变更日志发送到Elasticsearch作为同步的目的地。 4. 启动Canal实例:通过命令行或脚本启动Canal实例,让Canal开始监控MySQL的变更日志。 5. 解析并同步数据:Canal会实时监控MySQL的变更日志,一旦有变更,就会解析并发送到Elasticsearch。在Elasticsearch中,可以根据业务需求进行相应的处理,比如数据转换、数据筛选、数据拆分等,并将处理后的数据存储到Elasticsearch中。 通过以上步骤,就可以实现MySQL数据的实时同步到Elasticsearch中。Canal工具可以很好地解析MySQL的增量日志并将数据发送到Elasticsearch,保证数据的实时性和一致性。同时,Canal还支持分布式部署和高可用性,可以满足大规模数据同步的需求。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值