MTTR、MTTF、MTBF

可用度计算错误分析:

原始计算逻辑:

1、获取业务下单主机的 已处理告警和未处理告警信息
2、获取已处理告警的平均处理时间 alreadyProcessedAVG = (告警处理时间最大值updatetime-告警处理最小时间)/size
	   已处理告警size=0,则为0
3、获取未处理告警的平均时间untreatedAVG = (发生告警最大时间createTime-发生告警最小时间)/size
		未处理告警size=0,则为0
4 单机可用性 = alreadyProcessedAVG/(alreadyProcessedAVG+untreatedAVG)
		分子分母均为零,则可用性=100
		
	循环业务下主机,求可用性平均值
根据上述逻辑对告警系统可用度计算进行分析

1. 只存在已处理告警
在这里插入图片描述
(1)只存在已处理告警时, untreatedAVG 始终为0;

原始公式	
alreadyProcessedAVG/(alreadyProcessedAVG+untreatedAVG)
则可简化为 
alreadyProcessedAVG/alreadyProcessedAVG 
此时,单机可用性始终为1,即100%;公式正确

2. 只存在未处理告警
在这里插入图片描述
(1)只存在未处理告警时, alreadyProcessedAVG 始终为0;

原始公式	
alreadyProcessedAVG/(alreadyProcessedAVG+untreatedAVG)
则可简化为 
0 / (0 + untreatedAVG )
此时,单机可用性始终为0,即0%;

这种情况下当未处理告警为注意,告警,及严重级别时其实系统为可用状态,可用度为0不合适。

3. 已处理告警与未处理告警信息同时存在
(1)已处理告警与未处理告警信息同时, alreadyProcessedAVG 与 untreatedAVG 都不为0;

原始公式	
alreadyProcessedAVG/(alreadyProcessedAVG+untreatedAVG)
1. 若 alreadyProcessedAVG = 1, untreatedAVG = 1,则 单机可用性 = 1/2
2. 若 alreadyProcessedAVG = 50, untreatedAVG = 1,则 单机可用性 = 50/51
3. 若 alreadyProcessedAVG = 100, untreatedAVG = 1,则 单机可用性 = 100/101

可以看出已处理告警所花的平均时间越长,则单机的可用性越高,实际情况中,在一个系统可用周期中,应该是处理告警所花的时间越短则单机的可用性越高。

1. 若 alreadyProcessedAVG = 1, untreatedAVG = 1,则 单机可用性 = 1/2
2. 若 alreadyProcessedAVG = 1, untreatedAVG = 50,则 单机可用性 = 1/51
3. 若 alreadyProcessedAVG = 1, untreatedAVG = 100,则 单机可用性 = 1/101

可以看出未处理告警所花的平均时间越长,则单机的可用性越低,这种情况下逻辑正常

在是上面两种情况下根据所有告警计算,但是在实际情况中,注意级别,告警级别,严重级别的告警信息并不会造成系统的不可用,所以若只存在灾难级别的告警时,系统已经不可用,但是计算得出的单机可用度并不为0.

可用度计算方案:

术语:

MTTR、MTTF、MTBF是体现系统可靠性的重要指标,但是三者容易混淆,下文使用图解方式解释三者之间的区别,希望能起到解惑的效用。

MTTF (Mean Time To Failure,平均无故障时间),指系统无故障运行的平均时间,取所有从系统开始正常运行到发生故障之间的时间段的平均值。 MTTF =∑T1/ N

MTTR (Mean Time To Repair,平均修复时间),指系统从发生故障到维修结束之间的时间段的平均值。MTTR =∑(T2+T3)/ N

MTBF (Mean Time Between Failure,平均失效间隔),指系统两次故障发生时间之间的时间段的平均值。 MTBF =∑(T2+T3+T1)/ N

很明显:MTBF= MTTF+ MTTR
在这里插入图片描述

计算方案:

在告警系统中:

单机可用度 = MTTF / MTBF

MTTF(∑T1/ N) :
平均无灾难级别告警的时间

MTTR(∑(T2+T3)/ N)
灾难级别告警从产生到修复的平均时间

MTBF(∑(T2+T3+T1)/ N):

灾难级别告警从上次修复到下次产生并修复的平均时间

具体计算逻辑:

(1)当至少有一个未解决的灾难级别告警时:系统可用度为0%
(2)当有0个未解决的灾难级别告警时:
a. 若已解决的灾难级别告警数为0,则系统可用度为100%
b. 若已解决的灾难级别告警数大于0,则系统可用度采用下面公式计算

(∑T1/ N)/ (∑(T2+T3+T1)/ N)

= (∑T1)/ ∑(T2+T3+T1)

= ∑(第二条故障的开始时间 - 第一条故障的修复时间)/ 最后一条告警修复的时间 - 第一条告警修复的时间

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: MTTR(Mean Time To Repair,修复时间平均值)是指在设备出现故障后,修复该故障所花费的平均时间。MTTR的计算方法是将该设备所有故障修复所花费的时间总和除以设备故障次数。 MTTF(Mean Time To Failure,平均失效时间)是指设备正常运行的平均时间间隔,在设备运行过程中,设备会出现故障,MTTF表示从设备投入使用到第一次故障发生之间的平均时间间隔。MTTF的计算方法是将设备投入使用到第一次故障发生之间的时间总和除以设备发生故障的次数。 MTBF(Mean Time Between Failures,平均故障间隔时间)是指设备连续正常运行的平均时间间隔,即设备在无故障状态下连续运行的时间。MTBF的计算方法是将设备连续正常运行的时间总和除以设备出现故障的次数减一。 总结起来,MTTR是指修复设备故障所花费的平均时间,MTTF是指设备正常运行的平均时间间隔,MTBF是指设备连续正常运行的平均时间间隔。这些指标可以帮助评估设备的可靠性和维护效率,从而提高设备的运行效果和生产效率。 ### 回答2: MTTR(Mean Time To Repair)表示平均修复时间,是指设备或系统从发生故障到修复完毕的平均时间。计算MTTR的公式为:MTTR = 维修时间总和 / 维修次数。 MTTF(Mean Time To Failure)表示平均失效时间,是指设备或系统在正常使用条件下从启动到首次发生故障的平均时间。计算MTTF的公式为:MTTF = 正常使用时间总和 / 失效次数。 MTBF(Mean Time Between Failures)表示平均两次故障间隔时间,是指设备或系统在修复完毕后再次发生故障之间的平均时间间隔。计算MTBF的公式为:MTBF = 总运行时间 / 故障次数。 在计算MTTRMTTFMTBF时,需要记录设备或系统的运行时间和故障次数。通过对历史数据进行统计和分析,可以得出平均修复时间、平均失效时间和平均两次故障间隔时间,从而评估设备或系统的稳定性和可靠性。 需要注意的是,MTTRMTTFMTBF都是统计指标,其数值可能会受到不同因素的影响。因此,在计算和使用这些指标时,应考虑实际情况,并综合其他指标和因素进行评估。 ### 回答3: MTTR(Mean Time To Repair,修复时间平均值)、MTTF(Mean Time To Failure,故障发生时间平均值)和MTBF(Mean Time Between Failures,故障间隔时间平均值)都是指标,用于评估设备或系统的可靠性。 MTTR指的是从设备故障发生到修复完成的平均时间,计算方法是将维修时间总和除以故障次数。 MTTF指的是设备在正常工作状态下的平均工作时间,也可以理解为正常工作时间与故障次数的比值。 MTBF指的是设备出现故障后下一次故障之间的平均时间间隔,计算方法是把设备正常工作时间总和除以故障次数减一。 具体计算MTTRMTTFMTBF的方法如下: 1. MTTR = 维修时间总和 / 故障次数 维修时间总和是指所有故障的修复时间之和,故障次数是指设备发生故障的次数。 2. MTTF = 正常工作时间总和 / 故障次数 正常工作时间总和是指设备在正常运行状态下的累计时间,故障次数是指设备的故障次数。 3. MTBF = 正常工作时间总和 / (故障次数-1) 正常工作时间总和是指设备在正常运行状态下的累计时间,故障次数是指设备的故障次数减一。减一是因为MTBF是指故障之间的时间间隔。 通过计算MTTRMTTFMTBF,可以评估设备的可靠性和维修效率,进而制定合理的维护计划和提高设备的可靠性。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值