生产上一次redis的流出带宽使用率告警问题排查:
1、查看redis的性能监控,这里可以看到,报警节点和其他节点每秒处理的指令在除了hgetall上有区别外其他区别是不太多的,hgetall现在是其他的节点的10倍左右了,


告警设置的是85%,384M分给4个节点,每个节点92M,大概也就78.2M这样,那么就需要找出1s内请求获取所有这个key的内存,这个key的内容大小就是78.2M,即1024*78.2/403,大概等于198KB这样,然后根据离线全量Key分析,找到hash类型的数据,并且大小在198KB左右的,就很快就锁定了对应的key,根据对应的key,查找代码,发现代码中使用hgetAll,且这个方法每秒都会很多的消息量上来,所以这就是告警原因!

2、问题解决方案:优化代码,将hgetAll改成本地缓存即可!
3、上线,问题解决,效果如图:

1.1.2 一次Redis流出带宽使用率飙升问题分析
最新推荐文章于 2025-10-11 20:45:01 发布
2662

被折叠的 条评论
为什么被折叠?



