安全并正确地重启Elasticsearch集群

最新推荐文章于 2024-05-26 08:35:17 发布

喜马拉雅以南

最新推荐文章于 2024-05-26 08:35:17 发布

阅读量1.9k

点赞数 2

分类专栏： # Elasticsearch试炼 Elastic Stack 文章标签： elasticsearch

本文链接：https://blog.csdn.net/qq_26125865/article/details/106571755

版权

5 篇文章 1 订阅

订阅专栏

1 篇文章 0 订阅

订阅专栏

前言

elasticsearch本身具有高可用性，可以做到停机不停服务，在重启elasticsearch后可能存在数据丢失，或者是“启动ES后，怎么一直有大量的数据在迁移？”

原因有两点：

ES中的数据不是实时写入磁盘的。
数据进入ES后先进入data buffer segment和transientLog这两个buffer，（此处又涉及到数据防丢失的机制）然后进入操作系统文件系统缓存的数据段，最后再特定时机（两个条件，一个是segment到达容量，一个是到达refresh时间间隔）下才刷入磁盘。即在内存中有很多数据是没写入磁盘的。
ES的分片自动分配迁移机制。
当集群发现经过一分钟后（index.unassigned.node_left.delayed_timeout参数设置）还连接不上某个节点，就会把集群内的数据重新进行分布，即使后来节点重新连接上，原来的数据因为重新分布也无效了。

设置集群重新分配的类型，使用cluster.routing.allocation.enable设置选项。

启用或禁用分片重新分配的类型：

PUT _cluster/settings{
  "persistent": {
    "cluster.routing.allocation.enable": "none"
    }
}

POST _flush/synced

curl -X POST "localhost:9200/_ml/set_upgrade_mode?enabled=true&pretty"

# 或者是
POST /_ml/set_upgrade_mode?enabled=true&pretty

sudo systemctl stop elasticsearch.service

sudo -i service elasticsearch stop

kill $(cat pid)

cd  $ES_HOME/bin ./elasticsearch -d -p $ES_HOME/pid.txt

PUT _cluster/settings { 
    "persistent": {
        "cluster.routing.allocation.enable": null }
}

使用 Debian 或者 RPM 包进行更新:
使用rpm或者dpkg全装新包，所有文件安装将会被安装到操作系统上合适的位置，并且elasticsearch的配置文件将会被保留，不会被覆盖。
使用 zip 或者是tar 压缩包进行更新:
1. 解压压缩包到一个新的或指定的目录，如果你没有使用外部指定的 config
2. 如果不需要使用外部的 config目录和 jvm.options，可以复制旧版本的配置文件目录到新安装的配置文件目录。
  如果需要指定外部的 config目录和 jvm.options则需要配置环境变量ES_PATH_CONF Elasticsearch启动时将会在环境脚本elasticsearch-env 中进行调用，如下图：
  [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-sFw12iXf-1599405415427)(en-resource://database/1698:1)]@w=450
3. 在elasticsearch.yml中配置指定path.data ，即指定外部data目录路径，如果不使用外部指定data目录，可以把外部data目录复制到新安装的目录中。
如果使用了监控功能，当你更新elasticsearch集群并要复用监控数据时，监控时通过辨认经过持久化的节点UUID（独一无二的）进行区分的，这个UUID值存储在data目录里

关注