30.1 集群健康状态的解读
- 集群运行状况为:绿色、黄色、红色。
- 在分片级别:
- 绿色状态:表示集群健康;
- 黄色状态:表示所有主分片均已分配,但有一个或多个副本分片未分配。如果集群中的某个节点发生故障,则在修复该节点之前,某些数据可能不可用;
- 红色状态:表示存在一个或多个主分片未分配,因此某些数据不可用。在集群启动期间,伴随着主分片的分配过程,这可能会短暂发生。
30.2 定位红色或黄色的索引
- 第一步:确定你所知道的主要问题
- 例如节点宕机、磁盘空间(磁盘使用逼近或超过警戒水位线:85%、90%、甚至95%的磁盘使用率)问题等,这些问题很可能会造成集群状态的变化
- 第二步:确定哪些索引有问题,多少索引有问题
- _cat API 可以通过返回结果告诉这一点:
GET _cat/indices?v&health=red
GET _cat/indices?v&health=yellow
GET _cat/indices?v&health=green
- 如下就是:索引为黄色的截图
- 第三步:查看有问题的分片以及原因
- 这与索引列表有关&#