HP DL360G6 是HP在09年推出一款1U服务器,主流机型搭配P410/P410i 阵列卡,最近在调试一台旧机器时,发现安装CentOS7(1611)版后,不定时的,磁盘阵列会出现IO错误,接着系统挂起,物理磁盘离线。
具体现象为服务器控制台会打印一堆
blk_updatae_request I/O error dev sda sector xxxxxxx
blk_updatae_request I/O error dev sda sector xxxxxxx
blk_updatae_request I/O error dev sda sector xxxxxxx
sd 0:2:0:0: rejecting I/O to offline device
sd 0:2:0:0: rejecting I/O to offline device
以及默认的XFS文件块损坏的提示,在重新开机后阵列卡会提示以下内容
大致意思为控制器本次启动出现一些错误
1.从阵列加速发现一些有效的数据,将自动写入到阵列
2.阵列加速电池电量低,可能发生故障需要替换
再接着正常启动后,查阅资料,发现在CentOS7中使用了hpsa驱动替代了原来的cciss驱动可能会引起一些兼
容性问题,HP官方讨论组也发现P410i阵列卡早期固件也存在一些BUG,需要更新更新固件来解决。
CentOS 官方也有两篇类似的反馈
https://bugs.centos.org/view.php?id=13184
https://www.centos.org/forums/viewtopic.php?t=47011
解决办法
1.查看当前阵列卡固件版本为1.66,可升级至6.64解决问题
2.降级使用CentOS6无影响
从HPE下载最新的2015年发布的阵列卡固件
http://h20564.www2.hpe.com/hpsc/swd/public/detail?swItemId=MTX_2fe5ac5b7d9d489088825f3a4e
因固件升级不支持CentOS7的hpsa驱动,需要先把系统降级为CentOS6,也可以尝试下用LiveCD引导
执行阵列卡固件安装和升级
rpm -ivh hp-firmware-smartarray-14ef73e580-6.64-2.x86_64.rpm
/usr/lib/x86_64-linux-gnuhp-firmware-smartarray-14ef73e580-6.64-2/
./hpsetup
完成后重启,在阵列卡初始化过程中即可看到已升级至最新版本,重新将系统安装回CentOS7问题解决。