前几天,生产维护报某些地区的前台机器读数据很慢,初步怀疑是缓存域出了问题。
登录对应地区的缓存域所关联的应用域,查看日志,发现读缓存时间超过1000ms的记录有3716多个,超过500ms的有6000-20796个,该地区的所有应用域都有这种情况。
下面是正常的情况
ssh进入缓存域,查看节点关键info
指标均在可接受范围内
再查看内存使用情况:
info | grep -e "mem_fragmentation_ratio"
发现8379节点的碎片率很大,接近20
串行重启各个节点后,超时情况恢复正常