官方给我们提供的工具,能够给我们输出一些有用的监控数据,包括了机器的CPU、磁盘的IO、网络的情况、JVM情况、线程池、分片、磁盘使用情况、索引情况等等
美中不足的是,是这些指标数据,只是一堆指标数据。需要一些懂这些指标数据的人,来研判它,才能得出结果。看出es集群都有哪些问题。
希望以后能有时间,和这个诊断工具结合做一个es指标的研判工具,能够得出结论性的内容。
https://github.com/elastic/support-diagnostics#run-requirements
上边是官方文档,有指导如何使用它来给我们的es做一个健康检查(体检)。我看网上的文章也是翻译官方文档。个人觉得还是直接看官网更好一些。
如果想看中文,这里分享一个链接:Elastic Stack最佳实践系列:用官方诊断工具,故障排查,快人一步 - 腾讯云开发者社区-腾讯云