作为一家在2021年在美国纳斯达克上市的云端备份公司,Backblaze一直保持着对外定期发布HDD和SSD的故障率稳定性质量报告,给大家提供了一份真实应用场景下的稳定性分析参考数据。
以往报告解读系列参考:
Backblaze在2024年第二季度对284,386块硬盘进行了监测,这些硬盘分为29种型号。总体年度化故障率为1.71%,较上一季度略有上升,但仍低于去年同期。16种型号的硬盘保持在1.71%或以下的AFR,而13种型号的AFR高于此水平。
值得注意的是,两个Seagate型号的硬盘在第二季度实现了零故障率,其中16TB型号的终身AFR表现出色。零故障率的硬盘型号:
-
14TB Seagate:型号ST14000NM000J的14TB Seagate硬盘在第二季度未发生任何故障,但该型号的硬盘数量和运行天数相对较少。
-
16TB Seagate:型号ST16000NM002J的16TB Seagate硬盘同样在第二季度未发生任何故障,该型号的终身AFR为0.57%,表现出色。
最老的数据硬盘接近10年服务期限,而部分启动硬盘已经超过了10年的服务期限。
-
4TB Seagate:型号ST4000DM000的4TB Seagate硬盘是当前仍在服役中最老的硬盘型号,平均年龄为99.5个月。这些硬盘的数据将在接下来的一个或两个季度内使用内部开发的CVT系统进行迁移。
-
最老的硬盘:截至2024年第二季度末,最老的数据硬盘是在服务了9年11个月零23天的4TB HGST硬盘(型号:HMS5C4040ALE640)。然而,包含该硬盘的Backblaze Vault正在进行迁移,包括许多服务超过9年的硬盘。下个季度将看到是否有硬盘能进入10年俱乐部。
-
超过10年的启动硬盘:虽然没有数据硬盘达到10年服务期限,但有11台HDD启动硬盘超过了这一期限,其中一台500GB的WD硬盘(型号:WD5000BPKT)的服务期限超过11年。
12TB HGST硬盘的AFR出现了异常波动。型号HUH721212ALN604的12TB HGST硬盘在第二季度的AFR为7.17%,这是过去一年中该型号季度AFR的最大值。这导致其生命周期AFR在过去一年内从0.99%上升到了1.57%。
为了保证统计数据的有效性和可靠性,Backblaze设定了筛选条件,即每个型号至少要有500台硬盘在运行,并且累计运行天数超过100,000天。这样可以确保样本量足够大,以得到有意义的结果。经过筛选,共有25种型号的硬盘被纳入分析。这些硬盘型号覆盖了不同的容量和品牌。终身AFR是指硬盘在其整个生命周期中的年度化故障率,这可以帮助用户了解不同型号硬盘的长期可靠性表现。
为了建立给定硬盘型号的故障率随时间变化的模型,以优化硬盘更换和迁移策略,维持云存储服务的耐用性。Backblaze绘制了14种平均年龄不超过60个月的硬盘型号的当前终身AFR与平均年龄的关系图。
四个象限的解读
-
第一象限(Quadrant I):这些硬盘型号表现出良好的可靠性,较低的AFR表明它们在生命周期的早期阶段表现稳定。具有低于1.5%的终身AFR。位于这个象限右侧的硬盘型号在未来几个月可能需要更多关注,而左侧的型号则较为稳定。
-
第二象限(Quadrant II):这些硬盘型号的故障率略高,但仍在可接受范围内。这些硬盘型号的故障率高于1.5%,但仍然处于大约2%的合理范围内的终身AFR。关键在于随着时间推移,AFR不应显著增加。
-
第三象限(Quadrant III):目前没有硬盘型号位于这个象限,如果有的话也不必担心。原因是一些硬盘型号在早期可能会经历较高的故障率,随后按照“浴盆曲线”规律,随着年龄的增长,其AFR会下降。
-
第四象限(Quadrant IV):这些硬盘型号刚开始建立其故障率曲线,目前看来可靠性良好。这些硬盘型号的故障率曲线还需要一段时间来确定其长期趋势。
另外,超过60个月的硬盘型号的当前终身AFR与平均年龄的关系图如下:从图表上看,一切似乎都正常。第一象限中的硬盘型号表现出色,第二象限中的两个硬盘型号虽有待改进但仍可接受,而新硬盘型号到目前为止没有出现意外情况。
这张蛇形图表展示了每种硬盘型号在其整个生命周期中的故障率变化趋势。图表从24个月开始,以减少杂乱,但无论怎样,当硬盘型号的平均年龄超过60个月时,它们自然地分成了第一象限或第二象限。接下来我们将分别分析这两个象限中的硬盘型号。
第一象限(Quadrant I):截至2024年第二季度,共有五种硬盘型号位于第一象限。
-
-
4TB HGST硬盘(棕色和紫色线条):两条线几乎呈垂直状态,表明这些硬盘的故障率随着时间推移保持一致,特别是在服务60个月后。
-
6TB Seagate硬盘(红色线条):这条线也几乎呈垂直状态,故障率随着时间推移保持稳定。
-
8TB Seagate硬盘(蓝色线条):这条线的故障率随着年龄增长而增加,从服务60个月开始,大约两年的时间内,终身AFR从1.0%上升到近1.5%,然后趋于稳定。
-
8TB HGST硬盘(灰色线条):这条线的故障率同样随着时间增长而增加,在服务48个月后,终身AFR从约0.5%上升到1.0%,之后趋于稳定。
-
第二象限(Quadrant II)四种硬盘型号位于第二象限。
-
-
8TB Seagate硬盘(黄色线条)、10TB Seagate硬盘(绿色线条)和12TB HGST硬盘(青色线条):这三种型号的故障率在其生命周期中的某个点开始加速上升。8TB Seagate硬盘显示出了趋于稳定的迹象,但所有这三种型号都将被密切监控,如果趋势继续,则会进行更换。
-
4TB Seagate硬盘(黑色线条):这种型号正在通过CVT过程积极迁移和替换为16TB及以上容量的硬盘。因此,很难判断近乎垂直的故障率曲线是由于替换过程还是硬盘故障率随时间趋于稳定的结果。无论如何,这种型号的迁移预计在接下来的一个或两个季度内完成。
-
如果您看完有所受益,欢迎点击文章底部左下角“关注”并点击“分享”、“在看”,非常感谢!
精彩推荐: