产品可靠性需求

一 可靠性指标

可靠性需求反映了系统在一定条件下无故障地运行的能力。

计算公式

可靠性 = 总的有效运行时间 / 总运行时间。

可靠性分为硬件可靠性和软件可靠性。

1 硬件可靠性

硬件可能会出现故障。出现故障的原因是,设备元器件都是有使用寿命的,时间长了元器件就可能坏掉。整机的故障率受所有元器件的故障率的影响。为降低整机故障率,我们就要选用更优质的元器件。

硬件可靠性可以通过三个指标来评估。

a 平均无故障时间

所有设备平均多长时间发生一次故障。

b 维护响应时间

如果设备出现故障,就需要维修,维修人员应尽快到达现场,在企服产品中,如果对方承诺提供 7*24 小时维修服务,并且1小时达到现场,那么该公司的维修能力很强。这个指标被称为维护响应时间。

c 平均维护时间

维修人员在达到现场后,就应该尽快修好产品。在设计硬件时,就要考虑如何尽快修好。比如,设备电源支持热插拔,如果电源坏了,不用关机也能更换电源,这样维修时间就很短。要多长时间才能修好,这个时间被称为平均维护时间。平均维护时间是指修复一次故障所需的总时间,该时间包含维护响应时间,修好所用的时间等。

综上所述,硬件可靠性是平均无故障时间、平均维护时间的综合反映。如果一歀硬件产品的可靠性强,那么该产品用的时间长(体现可靠性),并且坏的次数少(体现平均无故障时间),坏了以后维修快(体现平均维护时间)。

硬件可靠性的提升体现在两方面。一方面,硬件要能稳定运行,无故障。另一方面,设备要支持冗余备份,如系统支持双电源,当一个电源坏了时,另一个仍然可用。

硬件可靠性还会受环境的影响。硬件对环境的湿度和温度都有要求,不适宜的温度和湿度将造成硬件故障。其要求又分硬件工作时的温度和湿度要求、硬件存放时的温度和湿度要求。

2 软件可靠性

软件可靠性和硬件可靠性是类似的,也有平均无故障时间、平均维护时间等指标。

首先,软件可靠性是建立在硬件可靠性之上的。如果没有硬件的正常工作,软件的正常工作就无从谈起。为了避免硬件故障导致软件不可用,我们将软件安装在多台设备上。此时,如果一台设备坏掉了,也不会影响软件的使用。

其次,在设计软件的时候应设计一些功能,来提升其可靠性。常见的是设计一些便于排错、便于恢复系统的功能,如定期进行数据备份,这样软件就可以快速从错误中恢复,也避免人为因素造成系统损坏。

最后,软件可靠性也包括系统的完整性。如果不出现数据丢失,就说明数据完整性比较好。但是系统不同,对完整性的要求也不同。比如,视频直播对数据完整性的要求比较低,偶尔丢失几个数据,并需影响视频的观看。

二 产品经理工作

产品经理应与研发人员协商,共同定义可靠性需求。我们将产品经理分为软件产品经理和硬件产品经理,他们的主要工作如下。

软件产品经理的工作。比如,定义备份功能,如餐饮软件要支持数据备份。这样数据在设备上坏掉后就可快速恢复,并且该恢复功能要有图形界面。定义数据完整性的要求,如说明该业务对数据完整性的要求高不高。

硬件产品经理的工作。比如,定义硬件规格,如硬件要支持冗余电源,支持双路供电等。再如,定义告警机制。当硬件出现某些故障,可以通过短信、界面和指示灯方式告知用户。

三 可靠性指标汇总

可靠性需求

平均无故障时间

产品出现故障的时间平均值,如电脑的平均无故障时间为15年,就是说电脑平均算起来,15年出故障。

平均维护时间

产品出现故障后平均完成维修的时间,包括在途时间和到达现场的维修时间,如果平均维护时间为0.5小时

维护响应时间

从发现故障到开始维修所需要的时间,比如,要求公司支持 7*24 小时随时响应,且1小时内开始维修,这就是对维护响应时间的要求

可靠性

可靠性 = 总的有效运行时间 / 总运行时间。如果一项业务的可靠性为99.999%,则在1年时间内,该业务中断5.26分

硬件环境需求

温度要求

分工作时和不工作时的温度要求,如工作温度为 -10摄氏度~40摄氏度

湿度要求

过高的湿度也会造成硬件故障,如湿度要求是 0%~95%

四 可靠性和可用性的异同

可靠性和可用性的概念很类似。区别是,可靠性是从系统角度讲产品有没有问题,可用性是从用户角度讲产品有没有问题。两者含义类似但视角不相同,产品不可靠并不一定意味着产品不可用。

比如,服务器硬件如果频繁出现故障,则说明硬件可靠性不好。但可靠性不好,不能说明系统不可用。因为一个设备坏了,其他设备仍可用,所以产品还是可用的。再如,服务器支持双电源冗余备份,如果其中一个电源经常坏,我们可以说系统可靠性不好。但另外一个电源仍能让系统工作,并去影响系统的可用性。

现在的大多数大型软件系统或物联网系统,都是在硬件不可靠的前提下,提升用户的可用性的。比如,即使某些网络设备坏了,现在的互联网体系也能正常上网,因为数据还可以通过其他设备传输。再如,现在各种云平台也能在任意服务器损坏的情况下,做到不丢失数据和不停止服务,因为一台服务坏了,其他服务器还照常工作。在现实生活中,我们用的网盘没有出现过数据丢失,也是因为在服务器端做了数据备份。

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值