ceph构建的分布式存储,对硬盘性能要求很高,有时硬盘SMART健康状态正常,但盘片可能存在问题了性能劣化,成为慢盘,导致分布式存储业务出现问题,此时在设备上尚无硬盘设备有故障灯,较难定位问题盘。本文探讨Linux环境下华为RH2288HV3服务器从操作系统层面定位慢盘的方法。
一、核对硬件及系统环境
1、查看当前服务器设备信息:
# dmesg |grep DMI
[ 0.000000] DMI: Huawei RH2288H V3/BC11HGSA0, BIOS 3.66 06/02/2017
2、查看当前系统OS版本:
# cat /etc/redhat-release
Red Hat Enterprise Linux Server release 7.5 (Maipo)
3、查看RAID卡型号 :
# lspci -k |grep RAID -A 2
01:00.0 RAID bus controller: LSI Logic / Symbios Logic MegaRAID SAS-3 3108 [Invader] (rev 02)
Subsystem: Huawei Technologies Co., Ltd. Device d207
Kernel driver in use: megaraid_sas
二、准备 MegaCLI命令行管理工具环境
RAID卡为Symbios Logic MegaRAID SAS-3 3108,可安装MegaCLI命令行工具来进行管理,通过broadcom官网下载megacli相应rpm包