基于canal的MySQL =＞ ES数据同步方案

最新推荐文章于 2024-05-21 18:06:25 发布

rapguys

最新推荐文章于 2024-05-21 18:06:25 发布

阅读量613

点赞数

分类专栏： canal 文章标签：搜索引擎

本文链接：https://blog.csdn.net/rapguys/article/details/118146452

版权

基于canal的MySQL=>ES数据同步方案

文章目录

基于canal的MySQL=>ES数据同步方案

1、概念

canal，译意为 水道/管道/沟渠

主要用途是基于 MySQL 数据库增量日志解析，提供增量数据订阅和消费

早期阿里巴巴因为杭州和美国双机房部署，存在跨机房同步的业务需求，实现方式主要是基于业务 trigger (触发器) 获取增量变更。从 2010 年开始，业务逐步尝试数据库日志解析获取增量变更进行同步，由此衍生出了大量的数据库增量订阅和消费业务。

在这里插入图片描述

2、应用场景

Elasticsearch 不支持事务。 ES通常在分布式系统架构中承担“搜索引擎”的角色，一般来说解决词类问题，可以把ES和支持ACID特性的关系型数据库结合起来使用。首先把对数据的更（增删改）操作在RDB中执行，然后把这些动作同步到Elasticsearch。通过这种方式，你将受益于数据库 ACID 事务支持，并且在 Elasticsearch 中以正确的顺序产生变更。并发在关系数据库中得到了处理。

以MySQL为例，如果要把数据从同步至ES，canal + binary log就是常用的一种增量解决方案。

3、原理

在这里插入图片描述

MySQL主备复制原理

MySQL master 将数据变更写入二进制日志( binary log, 其中记录叫做二进制日志事件binary log events，可以通过 show binlog events 进行查看)
MySQL slave 将 master 的 binary log events 拷贝到它的中继日志(relay log)
MySQL slave 重放 relay log 中事件，将数据变更反映它自己的数据

canal 工作原理

canal 模拟 MySQL slave 的交互协议，伪装自己为 MySQL slave ，向 MySQL master 发送dump 协议
MySQL master 收到 dump 请求，开始推送 binary log 给 slave (即 canal )
canal 解析 binary log 对象(原始为 byte 流)

4、优势

准实时性
性能好
一劳永逸

5、玩法

环境：

Java和ES兼容性：https://www.elastic.co/cn/support/matrix#matrix_jvm
- JDK：1.8
- Elasticsearch：7.x
- MySQL： 5.7
- Canal： 1.1.4
下载：

Github： https://github.com/alibaba/canal/

Github 咻咻咻： https://github.com/fhefh2015/Fast-GitHub

步骤：

保证Elasticsearch服务可用
保证MySQL服务可用

开启MySQL的 binary log（主备模式）

配置：
在mysql.cfg 文件中添加以下代码

server_id = 1 #开启主从模式后每个MySQL节点的id
log-bin = mysql-bin #bin-log的存储位置
binlog-format = ROW #选择存储binlog日志方式为ROW模式

重启MySQL服务：

systemctl restart mysqld

验证是否开启成功
使用如下代码需要登录 mysql 才可以

  SHOW VARIABLES LIKE 'log_bin';
  log_bin ON #开启

canal-deployer

配置conf/example/instance.properties

#canal示例的slaveId
canal.instance.mysql.slaveId=1234
#mysql地址<

最低0.47元/天解锁文章

rapguys

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
基于canal的MySQL =＞ ES数据同步方案

canal 笔记提示：这里可以添加系列文章的所有文章的目录，目录需要自己手动添加例如：第一章 Python 机器学习入门之pandas的使用提示：写完文章后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录canal 笔记前言一、pandas是什么？二、使用步骤1.引入库2.读入数据总结前言提示：这里可以添加本文要记录的大概内容：例如：随着人工智能的不断发展，机器学习这门技术也越来越重要，很多人都开启了学习机器学习，本文就介绍了机器学习的基础内容。提示：以下是本篇文章正文内容，
复制链接

扫一扫

专栏目录