AIX系统Disk Busy% 长期超过90%,请问应该从什么方向排查故障点?
客户反映业务系统访问数据特别慢,
通过topas检查,发现Disk Busy%一直超过90%甚至到100%,请问该从什么方向排查故障点,现在找不到故障点,让我很困惑。
方法一:
抓filemon,看具体是什么文件系统或lv繁忙
方法二:
filemon收集信息看一下,同时看看这个pv上文件系统是哪些,必要时对文件系统io进行调整
方法三:
filemon收集信息是正确的排查方向,但一般实际情况是即使找到了哪个LV或者哪个file繁忙,也对问题的解决起不到很大作用,比如说数据库,数据库的容器存放的就是那几个LV或者file,你不去查,也知道肯定是那里的IO有瓶颈,但是真正可能并不是说这里就是瓶颈,因为它只是瓶颈的现象而已。这时你可能会去查数据库,发现或许索引建的不对,每次查询SQL,没有命中索引,导致全表扫描,你修改了或者新建了索引,问题得到解决。相反,如果你只是一味的去觉得说IO有问题,就认为存储性能不行,一味的走这个方向,那就背道而驰了。
简单一点说就是具体问题具体分析。