Canal 索引构建

增量索引构建的要求

  • 准实时;
  • 性能;
  • 编程简化;

Canal | 简介

  • 消息管道;
  • source 为 MySQL 数据库;
  • target 为其他存储,比如 ElasticSearch;
  • Canal 伪装成一个 MySQL 主库的备库,感知 MySQL 中 binlog 的变化,并同步出来一个结构化的数据,交给 Canal 管道的消费端;

开启 MySQL 的 binglog

Ubuntu 用 APT Repository 安装 MySQL 的安装位置
  • /etc/mysql - 配置文件
  • /var/lib/mysql - 数据存放的位置
  • /usr/bin/mysql - 启动命令
  • /usr/lib/mysql - 插件
查看 MySQL 几个变量的值
  • 要保证 binlog 开启,并且格式是 ROW;
  • 如果不是上述配置的话,需要修改 /etc/mysql/mysql.conf.d/mysqld.cnf,然后还要给 MySQL 实例起个 server-id = 1;MySQL 8 的话,两个参数默认就是这样的,然后 server-id 给个唯一值就行了;
# 是否开启 binlog
show variables like 'log_bin';
# binlog 的格式
show variables like 'binlog_format';
创建复制用户
create user 'canal'@'%' identified by 'canal';

grant replication slave on *.* to 'canal'@'localhost';
grant replication client on *.* to 'canal'@'localhost';
grant select on *.* to 'canal'@'localhost';

flush privileges;

canal 配置 | 1.1.3

修改 canal.properties
  • 文件路径:/home/lixinlei/application/canal/1.1.3/canal.deployer-1.1.3/conf
  • 这一行注释掉;
#canal.instance.tsdb.spring.xml = classpath:spring/tsdb/h2-tsdb.xml
修改 instance.properties
  • 位置:/home/lixinlei/application/canal/1.1.3/canal.deployer-1.1.3/conf/example/instance.properties
canal.instance.mysql.slaveId=8

canal.instance.dbUsername=canal
canal.instance.dbPassword=canal
启动 canal
  • JDK 换成 8 才启动起来;
bin/startup.sh

canal.adapter | 1.1.4

下载源码
  • 在 IDEA 中打开 client-adapter module;
  • 修改 /home/lixinlei/project/canal-canal-1.1.4/client-adapter/elasticsearch/pom.xml 中的 ElasticSearch 的依赖版本,改成 7.3.0;
<dependency>
    <groupId>org.elasticsearch</groupId>
    <artifactId>elasticsearch</artifactId>
    <version>7.3.0</version>
</dependency>
<dependency>
    <groupId>org.elasticsearch.client</groupId>
    <artifactId>transport</artifactId>
    <version>7.3.0</version>
</dependency>
<dependency>
    <groupId>org.elasticsearch.client</groupId>
    <artifactId>elasticsearch-rest-client</artifactId>
    <version>7.3.0</version>
</dependency>
<dependency>
    <groupId>org.elasticsearch.client</groupId>
    <artifactId>elasticsearch-rest-high-level-client</artifactId>
    <version>7.3.0</version>
</dependency>
在总 module 的目录下重新打包 canal
  • 路径为:/home/lixinlei/project/canal-canal-1.1.4
  • 打包命令:mvn clean package -DskipTests
  • 报错:[ERROR] /home/lixinlei/project/canal-canal-1.1.4/client-adapter/elasticsearch/src/main/java/com/alibaba/otter/canal/client/adapter/es/support/ESConnection.java:[420,47] 无法将类 org.elasticsearch.client.RestHighLevelClient中的方法 bulk应用到给定类型;
  • 找到指定的 ESConnection.java 的 420 行,解决问题:return restHighLevelClient.bulk(bulkRequest, RequestOptions.DEFAULT);
  • 重新打包:mvn clean package -DskipTests
  • 报错:/home/lixinlei/project/canal-canal-1.1.4/client-adapter/elasticsearch/src/main/java/com/alibaba/otter/canal/client/adapter/es/ESAdapter.java:[225,56] 不兼容的类型: org.apache.lucene.search.TotalHits无法转换为long
  • 找到指定的 ESAdapter.java 的 225 行,解决问题:long rowCount = response.getHits().getTotalHits().value;
  • 重新打包:mvn clean package -DskipTests,终于成功了;
进入编译后生成的目录
  • /home/lixinlei/project/canal-canal-1.1.4/client-adapter/launcher/target/canal-adapter,里面的内容和直接从 Github 上下载二进制的包是一样的;
  • 把这个目录拷到正经的目录下,并改个名字 /home/lixinlei/application/canal/1.1.4/canal-adapter-es7
修改配置文件 application.yml
  • 文件路径:/home/lixinlei/application/canal/1.1.4/canal-adapter-es7/conf/application.yml
  • 这个配置主要是指明管道两端的 MySQL 和 ElasticSearch;
server:
  port: 8081
spring:
  jackson:
    date-format: yyyy-MM-dd HH:mm:ss
    time-zone: GMT+8
    default-property-inclusion: non_null

canal.conf:
  mode: tcp 
  canalServerHost: 127.0.0.1:11111
  batchSize: 500
  syncBatchSize: 1000
  retries: 0
  timeout:
  accessKey:
  secretKey:
  srcDataSources:
    defaultDS:
      url: jdbc:mysql://127.0.0.1:3306/dianping?useUnicode=true&useSSL=false
      username: canal
      password: canal
  canalAdapters:
  - instance: example 
    groups:
    - groupId: g1
      outerAdapters:
      - name: logger
      - name: es
        hosts: 127.0.0.1:9300
        properties:
          cluster.name: dianping-app
创建文件 shop.yml
  • 文件路径:/home/lixinlei/application/canal/1.1.4/canal-adapter-es7/conf/es/shop.yml
  • 其中 defaultDSexample 分别对应 application.yml 中的 defaultDSexample
dataSourceKey: defaultDS
destination: example
groupId: 
esMapping:
  _index: shop
  _type: _doc
  _id: id
  upsert: true
  sql: "select a.id,a.name,a.tags,concat(a.latitude,',',a.longitude) as location,a.remark_score,a.price_per_man,a.category_id,b.name as category_name,a.seller_id,c.remark_score as seller_remark_score,c.disabled_flag as seller_disabled_flag from shop a inner join category b on a.category_id = b.id inner join seller c on c.id = a.seller_id"
  commitBatch: 3000
启动 canal-adapter-es7
  • MySQL 8 要把 /home/lixinlei/application/canal/1.1.4/canal-adapter-es7/lib 下的驱动换一下;
  • 启动命令:bin/startup.sh
启动编译好的 canal-deployer-es7
  • canal.adapter-1.1.4 和 canal.deployer-1.1.3 是不兼容的,所以要把之前启动的 canal.deployer-1.1.3 换成 Maven 编译好的 canal.deployer-1.1.4;
  • 编译好的原路径:/home/lixinlei/project/canal-canal-1.1.4/deployer/target/canal,更改到新路径:/home/lixinlei/application/canal/1.1.4/canal-deployer-es7
  • 先关停 canal.deployer-1.1.3:bin/stop.sh
  • 把 canal.deployer-1.1.3 的 canal.properties 和 example/ 拷贝到 canal-deployer-es7 中;
  • 启动 canal-deployer-es7:bin/startup.sh
更新 MySQL 中 dianping 库的 shop 表
  • 日志文件 canal-adapter-es7/logs/adapter/adapter.log 立马可以感知到;
  • 在 ElasticSearch 中查询,也可以立马感知到;
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值