小科普 | 什么是MTBF?那MTTF、MTTD、MTTR又是啥?

买固态硬盘,我们会比较关注颗粒寿命,机械硬盘虽然几乎不用考虑长寿与否,除了考虑SMR/PMR记录方式外,最怕的其实就是坏,盘一挂数据未必能找回来,所以其故障率指标就显得尤为重要,

▌各种寿命指标

那这个指标一般就是MTBF了,全称平均无故障间隔(Mean TimeBetween Failure),也就是2次故障发生之间的时间段,取得是平均值。(MTBF=∑(T2+T3+T1)/ N,即总测试时间÷总失效量)

比方说MTBF达到100W小时,算下来时间足有114年,这并不是说114年无故障。由于MTBF=1/λ,λ=总失效数量÷总测试时间=1/MTBF=1/114年,最终得出其年故障率约0.87%,一万块硬盘里有87块出故障。

这就是AFR年平均故障率,一般厂商也不会标,可以自己推算出来的。AFR=1 / (MTBF / 365 / 24),比方高端盘的MTBF是200w小时,则AFR≈0.44%。

另外还有MTTF指标,他才是平均无故障时间(Mean TimeTo Failure),一般是从你硬盘开始正常用,到发生故障的时间(MTTF=∑T1/ N)。对于用户来说心里更有个准儿。

MTTR则是平均修复时间(Mean TimeTo Repair),等出现故障送修,到维修结束之间的平均值(MTTR=∑(T2+T3)/ N),这个值衡量硬盘的“可修复性”,不只是说坏了跑售后,

其实硬盘本身对错误有自动修复机制,不是所有问题都不可修复。它也是个平均数,各个方面都会影响这个值。(另外,维修换新时间应当计算上重写信息到新盘的时间)

另外有错误也未必能发现,有一个MTTD,也就是平均故障检测时间(Mean Timeto Detect),不过一般不会提到,因为故障实际上已经出现了,算在故障周期之中。总的来讲MTBF= MTTF+ MTTR,也就是平均发生一次故障事件循环周期。

▌在哪儿能看到

比方说最常见的西数蓝盘、希捷酷鱼,这种都是不标的,甚至官网技术文档里都没有。按照以前默认的100W小时,那也是以5x8h计算的,

而主流NAS、监控盘也都是100W小时,但是以7x24h环境计算的。虽然看着没什么不同,但可以理解为在高压高负载环境下,普通盘的寿命可能稍差一些。

不过哪怕是NAS专用盘,每年出现挂盘的事件也不少,所以组NAS等需要存储大量数据的,都会组RAID多盘备份,挂一个还能接着用。

企业盘200W小时起步,高端点儿的250W小时。虽说坏盘是低概率事件,运气好的可能一辈子都遇不上一次,但厂商不标总归信息是不透明的,能上高端盘肯定还是上高端盘放心。

▌总结

但高端盘现在都是大容量,现在动辄8T起步,加上这几个月来大幅涨价,哪怕临逢618也入手无望了。只有低容量普通盘还是原来的配方、还是原来的价格。不过目前看来,矿盘热度过去,价格有所回落。

另外硬盘市场市场也不能贪便宜,翻新盘蛮多的,水货得自己转保,部分品牌由于外包售后,还出现过拒保或乱保的情况。所以真要遇到什么问题,往往很难解决,哪怕给换新数据也未必保得住,最好还是多买几块盘平常做好备份。当然备份也可以用各类网盘同步解决。

另外MTBF等都只是理论值,事实上还得摸奖,什么盘好什么盘差,用数以万计硬盘的数据中心最有发言权,每年他们都会给出其“季度硬盘故障报告”,比方说BackBlaze,今年Q1的AFR表已经出了。

个别投用不久的新盘基本都是0故障率,其中希捷 ST6000DX000 6TB平均使用71.8个月,故障率也几乎为0,不过只有886片样本数量较少。样品数量极大的里,表现最好的是HGST HMS5C4040BLE640 4TB,一万多块的AFR仅0.32%,大容量盘中表现最好的则是HGST HUH721212ALN604 12TB。

另外目前各容量下质量最好的排行也更新了,这些可以说是相对更放心入手的了。

### 回答1: MTTR(Mean Time To Repair,修复时间平均值)是指在设备出现故障后,修复该故障所花费的平均时间。MTTR的计算方法是将该设备所有故障修复所花费的时间总和除以设备故障次数。 MTTF(Mean Time To Failure,平均失效时间)是指设备正常运行的平均时间间隔,在设备运行过程中,设备会出现故障,MTTF表示从设备投入使用到第一次故障发生之间的平均时间间隔。MTTF的计算方法是将设备投入使用到第一次故障发生之间的时间总和除以设备发生故障的次数。 MTBF(Mean Time Between Failures,平均故障间隔时间)是指设备连续正常运行的平均时间间隔,即设备在无故障状态下连续运行的时间。MTBF的计算方法是将设备连续正常运行的时间总和除以设备出现故障的次数减一。 总结起来,MTTR是指修复设备故障所花费的平均时间,MTTF是指设备正常运行的平均时间间隔,MTBF是指设备连续正常运行的平均时间间隔。这些指标可以帮助评估设备的可靠性和维护效率,从而提高设备的运行效果和生产效率。 ### 回答2: MTTR(Mean Time To Repair)表示平均修复时间,是指设备或系统从发生故障到修复完毕的平均时间。计算MTTR的公式为:MTTR = 维修时间总和 / 维修次数。 MTTF(Mean Time To Failure)表示平均失效时间,是指设备或系统在正常使用条件下从启动到首次发生故障的平均时间。计算MTTF的公式为:MTTF = 正常使用时间总和 / 失效次数。 MTBF(Mean Time Between Failures)表示平均两次故障间隔时间,是指设备或系统在修复完毕后再次发生故障之间的平均时间间隔。计算MTBF的公式为:MTBF = 总运行时间 / 故障次数。 在计算MTTR、MTTFMTBF时,需要记录设备或系统的运行时间和故障次数。通过对历史数据进行统计和分析,可以得出平均修复时间、平均失效时间和平均两次故障间隔时间,从而评估设备或系统的稳定性和可靠性。 需要注意的是,MTTR、MTTFMTBF都是统计指标,其数值可能会受到不同因素的影响。因此,在计算和使用这些指标时,应考虑实际情况,并综合其他指标和因素进行评估。 ### 回答3: MTTR(Mean Time To Repair,修复时间平均值)、MTTF(Mean Time To Failure,故障发生时间平均值)和MTBF(Mean Time Between Failures,故障间隔时间平均值)都是指标,用于评估设备或系统的可靠性。 MTTR指的是从设备故障发生到修复完成的平均时间,计算方法是将维修时间总和除以故障次数。 MTTF指的是设备在正常工作状态下的平均工作时间,也可以理解为正常工作时间与故障次数的比值。 MTBF指的是设备出现故障后下一次故障之间的平均时间间隔,计算方法是把设备正常工作时间总和除以故障次数减一。 具体计算MTTR、MTTFMTBF的方法如下: 1. MTTR = 维修时间总和 / 故障次数 维修时间总和是指所有故障的修复时间之和,故障次数是指设备发生故障的次数。 2. MTTF = 正常工作时间总和 / 故障次数 正常工作时间总和是指设备在正常运行状态下的累计时间,故障次数是指设备的故障次数。 3. MTBF = 正常工作时间总和 / (故障次数-1) 正常工作时间总和是指设备在正常运行状态下的累计时间,故障次数是指设备的故障次数减一。减一是因为MTBF是指故障之间的时间间隔。 通过计算MTTR、MTTFMTBF,可以评估设备的可靠性和维修效率,进而制定合理的维护计划和提高设备的可靠性。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值