ElasticSearch故障处理方案

最新推荐文章于 2024-08-12 20:44:23 发布

zhaobingkun

最新推荐文章于 2024-08-12 20:44:23 发布

阅读量2k

点赞数 1

分类专栏：运维文章标签： elasticsearch

原文链接：http://blog.itpub.net/177006/viewspace-2698656/

版权

运维专栏收录该内容

44 篇文章 0 订阅

订阅专栏

1、 java.io.IOException: failed to find metadata for existing index XXX

场景描述：

在节点启动的时候，有时会出现这类问题，导致节点重启失败。出现这种情况多是因为状态为Close的索引引起的

处理方法：

进入当前节点的data目录： /esdata/nodes/0/_state

将 manifest开头的文件删除或重命名

再启动该节点就可以了，启动成功后该 manifest文件会自动生成。

2、 failed to create shard, failure IOException[failed to obtain in-memory shard lock]; nested: ShardLockObtainFailedException[[test-test][3]: obtaining shard lock timed out after 5000ms];

场景描述：

集团出现分片无法重新分配，分析原因发现示上述描述，从字面上的意思来看是当前分片被锁定，导致无法分配

当时集群出现这类问题时：该索引没有副本，导致集群状态为红色的，使用 POST /_cluster/reroute?retry_failed=true 无法恢复。

解决方法：

第一种：

首先将将自动分片的配置关闭，通过 GET _cluster/allocation/explain 获取无法分配的分片所对应的主机信息

杀掉当前节点，重新启动节点

使用POST /_cluster/reroute?retry_failed=true 恢复（本集群经验证可以）

第二种：

将索引关闭，再打开(网上百度的）（由于当前索引再用，无法关闭，没有验证该方法，大家可以试试）

3、 kernel: INFO: task kthreadd:2 blocked for more than 120 seconds.

kernel: "echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables this message.

场景描述：

elasticsearch版本是6.3.0，linux版本是7.2，文件系统采用的xfs：现象是：ES节点主机频繁夯死，ES集群状态异常。必须重启主机才能正常使用。

查看系统日志信息，发现大量的xfs日志信息。

解决方法：

新建集群存储采用的ext4格式后，就没有出现过类似的情况。估计与xfs文件系统有关系。

今天就写到这吧，以后发现新的情况再补充

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
ElasticSearch故障处理方案

1、java.io.IOException: failed to find metadata for existing index XXX 场景描述：在节点启动的时候，有时会出现这类问题，导致节点重启失败。出现这种情况多是因为状态为Close的索引引起的处理方法：进入当前节点的data目录：/esdata/nodes/0/_state 将 manifest开头的文件删除或重命名再启动该节点就可以了，启动...
复制链接

扫一扫

专栏目录

zhaobingkun CSDN认证博客专家 CSDN认证企业博客

码龄22年

39: 原创

13万+: 周排名

80万+: 总排名

36万+: 访问

: 等级

3216: 积分

35: 粉丝

63: 获赞

38: 评论

273: 收藏

私信

关注

热门文章

分类专栏

管理 19篇
运维 44篇
研发 66篇
数据库 22篇
nosql 1篇

最新评论

用flink cdc sqlserver 将数据实时同步到clickhouse
琦哥的秘密花园: Caused by: com.microsoft.sqlserver.jdbc.SQLServerException: “Encrypt”属性设置为“true”且 “trustServerCertificate”属性设置为“false”，但驱动程序无法使用安全套接字层 (SSL) 加密与 SQL Server 建立安全连接:错误:sun.security.validator.ValidatorException: PKIX path building failed: sun.security.provider.certpath.SunCertPathBuilderException: unable to find valid certification path to requested target 回报这个错误且暂时无解
用flink cdc sqlserver 将数据实时同步到clickhouse
合蘇: 为什么我弄了老是说我缺依赖啊
用flink cdc sqlserver 将数据实时同步到clickhouse
weixin_41620638: 开启多台会不会重复处理
关于clickhouse在insert时报SQLFeatureNotSupportedException的解决办法
跑调却靠谱: 超级有用！
selenium显示等待WebDriverWait的使用
osako_suguru: 太多，都不想看下去了

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。