简述:
硬盘在使用中,不可避免会出现“坏道”;这个问题在硬盘设计时厂家已经考虑到,所有硬盘,都会有一些冗余空间用于做“坏道映射”,就是说可以利用这些冗余空间来替代使用过程中出现的坏道;替换后,出现坏道的硬盘可以继续使用。------有个例外是,如果坏道增长的速度特别快,那表示硬盘有了硬件故障,这种情况建议更换硬盘。
问题现象:
通常,SATA盘出现Current_Pending_Sector后,在日志中会出现medium error或出现critical target error等报错,查看磁盘smart info发现Current_Pending_Sector及Offline_Uncorrectable计数不为0(如下图),Reallocated_Sector_Ct可能也不为0,并伴随磁盘failed或osd down的情况。
Solution:
针对此问题,建议在确认数据无丢失风险的情况下,使用附件脚本对报错SATA盘进行修复,经多次测试,该脚本能够有效对此类扇区进行修复,修复完成后情况如下,查看SATA盘Current_Pending_Sector计数已为0
操作方法:
1、unzip;
2、umount /dev/sd$?
3、./disk_repair sd$?
Ps:经测试,一般10TB磁盘耗时1.5h,HP服务器配置的8TB SATA盘有时耗时5h左右(与阵列卡、RAID等有关)。建议判孤通过后再操作,修复完成后建议格式化磁盘,再重建服务。