0x01 缘由
目前外场一台服务器(用于DB\ES节点\NFS节点)IO相当高,利用zabix + 企业微信 ,经常告警,相当烦人,于是稍微分析和学习了下。
0x02 磁盘阵列基础
相比仅介绍一个使用对比:
0x03 工具MegaCli
查看RAID级别
/opt/MegaRAID/MegaCli/MegaCli64 -LDInfo -Lall -aALL | more
查看RAID卡信息,主要输出RAID卡的一些配置信息
/opt/MegaRAID/MegaCli/MegaCli64 -ADPallInfo -aALL | more
RAID Level : Primary-1, Secondary-0, RAID Level Qualifier-0
Size : 1.086 TB
State : Optimal
Strip Size : 128 KB
Number Of Drives per span:4 //表示每4个物理盘做成一个RAID1盘组
Span Depth : 2 //表示共2个RAID1盘组做成了RAID10
查看当前raid缓存状态,
raid缓存状态设置为wb的话要注意电池放电事宜,设置电池放电模式为自动学习模式
/opt/MegaRAID/MegaCli/MegaCli64 -ldgetprop -dskcache -lall -aall
0x04 工具atop
一款用于监控Linux系统资源与进程的工具,它以一定的频率记录系统的运行状态,所采集的数据包含系统资源(CPU、内存、磁盘和网络)使用情况和进程运行情况,并能以日志文件的方式保存在磁盘中,服务器出现问题后,我们可获取相应的atop日志文件进行分析。
atop -dl