硬盘坏道可能会造成存储池降级、损毁,如果只是存储池降级,更换硬盘并重新组建RAID可能可以解决问题;如果是存储池损毁,问题可能更严重 —— 如果你没有做好数据备份,可能就会丢失珍贵的数据!
上篇文章(存储空间堪用降级、损毁,怎么应对?请戳我)我们介绍过遇到存储池堪用降级、损毁的处理措施,这一次晖姑娘要教你在存储池损毁之前,就做好预防工作。
第一步,进行 S.M.A.R.T. 检测
定期帮硬盘进行 S.M.A.R.T. 检测可以让你掌控硬盘的健康状况,如果发现硬盘异常就可以及时替换故障硬盘。S.M.A.R.T. 是一种自动监测分析和报告技术,支持这种技术的硬盘可以提供磁头、盘片、马达的运行状况,并且针对预设的安全值进行分析。
进入“存储空间管理员 > HDD/SSD”,选择“硬盘”并且点击“状况信息”,进行快速或完整的S.M.A.R.T.检测,你会发现...
S.M.A.R.T. 信息根本看不懂?!这么多参数,哪个是重要的呢?
你可以特别关注几个跟坏道有关的编号数值:
编号 5(Reallocated Sector Count 重定位磁区计数)
编号 196(Reallocation Event Count 重定位事件计数)
编号 197(Current Pending Sector Count 等候重定的扇区计数)
编号 198(Uncorrectable Sector Count 无法校正的扇区计数)
只要原始资料数值不是0,你的硬盘就有可能损坏。当硬盘的S.M.A.R.T数值异常时,建议您将有问题的硬盘替换掉。一旦硬盘出现物理坏道,继续使用可能会让坏道越来越密集,最后造成硬盘损毁,数据无法读取。
注:系统默认的安全数值是50,但是根据技术小哥建议,这几个编号数值如果不是0,建议更换硬盘。
第二步,通过系统通知预警硬盘错误
除了进行S.M.A.R.T.检测,你还可以通过系统通知重要事件,来掌控硬盘状态。打开控制面板 > 通知设置 > 高级设置,点击“内部存储”,勾选以下6个事件,就能更好的掌控硬盘状态。
硬盘重新连接(ICRC错误)警报
硬盘重新识别(IDNF错误)警报
启动时硬盘重新连接警报
硬盘读取(UNC错误)异常警报
如果你收到以上的错误通知,可能是硬盘有问题的早期征兆,如果持续收到警报通知的话,建议及早将数据备份并且更换硬盘。除了以上4个事件,以下这2个也需要特别注意。
硬盘坏扇区超出上限
磁盘输出/输入错误
如果你持续收到警报通知,可以先进行完整的S.M.A.R.T检测,深入查看硬盘的健康状态。
除了以上工具,如果你用的是希捷酷狼硬盘,DSM整合了希捷IHM硬盘健康管理工具,对硬盘进行更全面的检测,预知硬盘将会发生的故障。
好文推荐:IHM | 硬盘健康管理工具
硬盘坏道的原因有很多,数据能抢救回来是最好的,但是万一呢…NAS老司机们可能都知道群晖【备份3-2-1原则】,重要的事说三次,重要的数据要存三份啊