ZK性能压力是否过大的判断方法以及相关核心指标

李姓门徒

已于 2024-01-31 22:28:54 修改

阅读量1.1k

点赞数 39

分类专栏： Zookeeper 分布式中间件文章标签： zookeeper 架构中间件

于 2024-01-29 17:25:40 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43845924/article/details/135879075

版权

分布式同时被 3 个专栏收录

42 篇文章

订阅专栏

20 篇文章

订阅专栏

7 篇文章

订阅专栏

本文讨论了在生产环境中如何通过监控机器层面的CPU、内存、load、磁盘I/O等，GC层面的oldGC频率，以及zk服务端的请求队列、watch数量、znode数量和大小等指标来判断zk集群的压力和性能瓶颈。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

文章目录

1. 机器层面
2. GC层面
3. zk的相关指标
4 其他指标

zk服务端的基础指标没有发现明显异常，但是客户端时不时出现超时现象，由于部分客户端处理逻辑很简单，只是单存的读写zk，如果读写超时则断开相关链接，因此面临客户端和服务端之间的极限拉扯。对于生产环境中，如何判断一个zk集群压力，是否到达性能瓶颈，是一个重要的课题，本文探讨如何分析和判断zk集群是否压力过大，以及相关的指标。

1. 机器层面

cpu使用率不超过60%
内存使用率不超过80%
机器load不超过cpu核心数
磁盘io，读写await不超1ms

2. GC层面

old gc不过于频繁

3. zk的相关指标

zk的排队请求队列，不超过200，
zk的watch数量，不超100w
zk的znode数量不超过50w
zk的znode大小不超过1G
zk的单节点连接数不超过最大连接数，也不能超过5k

4 其他指标

可以进一步参考 ZK监控方法以及核心指标

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。