【ElasticSearch】ElasticSearch节点可用机器内存减少后写入性能下降问题排查

最新推荐文章于 2024-09-30 16:11:21 发布

NEUpanning

最新推荐文章于 2024-09-30 16:11:21 发布

阅读量81

点赞数

文章标签： elasticsearch 大数据搜索引擎

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_45857154/article/details/134551657

版权

现象

ElasticSearch节点所在机器部署了其他服务后，ElasticSearch的写入性能下降了。使用cgroup隔离了ES进程和其他服务的CPU，服务部署后ElasticSearch节点可用机器内存减少了一半以上

理论分析

部署其他服务后后ES可用的page cache量下降了一半，ES依赖page cache进行写操作，page cache大小降低可能导致page fault发生频率增高，影响写入性能

测试过程

部署ES，模拟正常的写入流量
执行sar -B 1 60命令，观察page cache指标
创建一个占144GB的进程，该进程除了占内存外无其他操作
观测page cache等指标

测试结果

page cache使用量下降，从128GB降到46GB
page in, page out, major page fault频率显著增加（06:11:48之后

操作时间    pgpgin/s pgpgout/s   fault/s  majflt/s  pgfree/s pgscank/s pgscand/s pgsteal/s    %vmeff

操作前1分钟  22.00 276339.07  86604.02      0.02 144997.05 4564847.45   9912.78   2965.77      0.06
操作后1分钟 987.20 258302.65 440210.45      2.23 474992.83 3564184.18 1136200.70 347292.93      7.39
操作后2分钟 7654.67 230166.48 943175.17      5.95 227220.80 4083424.47 636770.77 106352.42      2.25
操作后3分钟 5579.42 282259.42 469521.05      3.35 120995.90 4617239.30  67159.00   8024.97      0.17
操作后2小时 11628.35 292470.47 433449.10      3.82 149460.33 3524461.10      0.00     68.77      0.00

磁盘读IO上涨，每分钟的read_request从个位数涨到几百。CPU.iowait上涨，从4%上涨到9%作业。原因是page fault会触发读磁盘数据到page cache
由于写入流程触发page fault导致写入延时增加，ES写入性能下降，吞吐大约下降了21%，延迟上涨了20%

结论

内存占用导致page cache空间减少，继而ES写入性能下降

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

NEUpanning CSDN认证博客专家 CSDN认证企业博客

码龄5年

39: 原创

57万+: 周排名

7万+: 总排名

3万+: 访问

: 等级

711: 积分

241: 粉丝

298: 获赞

6: 评论

326: 收藏

私信

关注

热门文章

最新评论

ES集群状态为红色但没有处于Unassigned状态的主分片问题排查
CSDN-Ada助手: 恭喜您撰写第17篇博客！标题很引人注目，内容也很有价值。解决ES集群状态为红色的问题是一个挑战，而您对于没有处于Unassigned状态的主分片的排查方法进行了深入探讨，这对那些遇到类似问题的读者非常有帮助。接下来，我建议您可以考虑分享更多关于ES集群状态异常的排查技巧，或者深入探讨其他与ES相关的主题。你的经验和知识无疑会对许多人有所帮助。希望您能继续保持创作，并继续分享您的宝贵见解。谦虚地说，我期待着您的下一篇博客！
【ElasticSearch】ES集群启动时master内存打满问题排查
CSDN-Ada助手: 恭喜您撰写了第18篇博客！标题看起来非常有吸引力，我对您解决ES集群启动时master内存打满问题的经验十分感兴趣。您的文章内容一定对使用ElasticSearch的读者非常有帮助。接下来，我建议您在未来的博客中可以探讨一些与ElasticSearch集群相关的高级主题，例如优化查询性能或者处理大规模数据的技巧。期待您继续分享有关ElasticSearch的知识，谢谢！
【ElasticSearch】TCP keep-alive机制与ElasticSearch的keep-alive机制
CSDN-Ada助手: 恭喜您撰写了第19篇博客！对于ElasticSearch的TCP keep-alive机制与ElasticSearch的keep-alive机制的探讨让我受益匪浅。不过，我觉得如果能够加入一些实际案例或者使用经验会更加生动和实用。希望您在下一篇博客中能够继续分享您的见解，并且期待您的更多精彩内容！
ElasticSearch客户端迁移到Rest Client后，ElasticSearch节点内存打满问题排查
CSDN-Ada助手: 恭喜您撰写了第16篇博客！标题“ElasticSearch客户端迁移到Rest Client后，ElasticSearch节点内存打满问题排查”非常引人注目。您在博客中详细解释了如何排查ElasticSearch节点内存打满的问题，这对于遇到类似问题的读者来说无疑是非常有帮助的。我想对您的持续创作表示赞赏，您的博客内容一直都非常有深度和实用性。接下来，我建议您考虑分享一些关于ElasticSearch的性能优化技巧或者最佳实践，这将进一步丰富您的博客内容，并且对读者来说也是一个非常有价值的主题。期待您未来更多的博客文章，谢谢您的分享！
集群qorum数量master-eligible节点掉线解决方法
CSDN-Ada助手: 云原生入门技能树或许可以帮到你：https://edu.csdn.net/skill/cloud_native?utm_source=AI_act_cloud_native

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。