elasticsearch升级和索引重建

最新推荐文章于 2024-07-25 16:30:40 发布

冲浪中台

最新推荐文章于 2024-07-25 16:30:40 发布

阅读量712

点赞数

文章标签： elasticsearch 大数据搜索引擎

本文链接：https://blog.csdn.net/Z__7Gk/article/details/131662725

版权

1.背景描述

es在本公司承载三个部分的业务，站内查询，订单数据统计，elk日志分析。

2020年团队决定对elasticsearch升级。es（elasticsearch缩写，下同）当前版本为1.x，升级到5.x版本。

5.x支持如下新特性：

支持lucene 6.x，磁盘空间少一半，索引时间少一半，查询性能提升25%
Java rest client （high level api）
Painless 脚本相比groovy脚本，更安全，更简洁，更好的性能

对于站内查询和订单数据统计，当前业务架构是

mysql -> canal -> kafka -> (es Index server) -> es

(可以考虑使用kafka connector 代替canal)

1.1 如何配置 mysql -> canal -> kafka

1.1.1. 配置mysql

开启binlog

[mysqld]
log-bin=mysql-bin # 开启 binlog
binlog-format=ROW # 选择 ROW 模式
server_id=1 # 配置 MySQL replaction 需要定义，不要和 canal 的 slaveId 重复

授权给canal用户，让其有复制权限

CREATE USER canal IDENTIFIED BY 'canal';  
GRANT SELECT, REPLICATION SLAVE, REPLICATION CLIENT ON *.* TO 'canal'@'%';
-- GRANT ALL PRIVILEGES ON *.* TO 'canal'@'%' ;
FLUSH PRIVILEGES;

1.1.2 配置canal

下载 https://github.com/alibaba/canal/releases/download/canal-1.1.6/canal.deployer-1.1.6.tar.gz

修改 conf/canal.properties

# tcp, kafka, rocketMQ, rabbitMQ, pulsarMQ
canal.serverMode = kafka # 由kafka消费

kafka.bootstrap.servers = 127.0.0.1:9092
kafka.acks = all
kafka.compression.type = none
kafka.batch.size = 16384
kafka.linger.ms = 1
kafka.max.request.size = 1048576
kafka.buffer.memory = 33554432
kafka.max.in.flight.requests.per.connection = 1
kafka.retries = 0

修改 conf/example/instance.properties

# username/password
canal.instance.dbUsername=canal
canal.instance.dbPassword=canal
canal.instance.defaultDatabaseName=mysql_test # 同步的数据库

# mq config
canal.mq.topic=canal_topic # 在kafka的topic

启动canal

./bin/start.sh

1.1.2 启动zookeeper 和 kafka

brew services start zookeeper
brew services start kafka

1.1.3 测试

在db中添加数据，可以使用kafka 脚本看到同步数据

INSERT INTO `mysql_test`.`user` (`id`, `name`) VALUES ('6', 'Bob');

➜  bin ./kafka-console-consum

最低0.47元/天解锁文章

冲浪中台

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
elasticsearch升级和索引重建

但是总结起来，依然后很多收获，从架构，代码细节上都有改进的空间。因为online index和new index 使用的是相同的kafka consumer group，所以必须停掉online index的消费功能。new index创建索引的时候默认副本数为0，现在动态调整副本数为业务需要的值。我们使用索引重建程序来新建索引。重建索引具体步骤如下，我们称线上索引为online index, 新创建的索引为new index。es在本公司承载三个部分的业务，站内查询，订单数据统计，elk日志分析。
复制链接

扫一扫