一、可靠性基础知识
1 可靠性工程的发展
- 可靠性工程的问世:1957年,AGREE的《军用电子设备可靠性》。
- 可靠性工程的全面发展:20世纪60年代,F-15A飞机、“水星”和“阿波罗”宇宙飞船的可靠性要求。
- 可靠性工程的步入成熟:20世纪70年代,美国建立了集中统一的可靠性管理机构;制定了可靠性设计、试验和管理的方法等。
- 可靠性工程向纵深方向发展:20世纪80年代至今,可靠性维修性管理制度化;可靠性技术在各领域的深入应用。
总的来说可归纳概括为:
- 分散的可靠性管理部门 —> 专门的可靠性管理机构
- 仅注重武器装备性能 —> 可靠性与性能并重
- 侧重于电子设备可靠性—> 关注非电产品可靠性
- 侧重于硬件可靠性 —> 软硬件可靠性并重
- 采用宏观统计方法—>注重机理的分析
- 采用手工定性可靠性分析 —> 结合计算机辅助手段
2 产品质量与可靠性的关系
- 质量:一组固有特性满足要求的程度(ISO9000 )。固有是指产品本来就有的,如顾客关心的功能特性、通用特性。
- 可靠性:产品在规定条件下和规定时间内,完成规定功能的能力(一般用概率度量)( GJB451A-2005)。(三规定一能力),可靠性是质量的一种特性。
3 可靠性的分类
- 固有可靠性:通过设计和制造赋予产品的,并在理想的使用和保障条件下所具有的可靠性,是产品的一种固有属性,产品开发者可以控制的。
- 使用可靠性:产品在实际使用条件下所表现出的可靠性,反映产品设计制造、使用、维修、环境等因素的综合影响。
- 基本可靠性:产品在规定条件下和规定时间内无故障的工作能力,反映产品对维修资源的要求。
- 任务可靠性:产品在规定的任务剖面内完成规定功能的能力。评定任务可靠性时,仅考虑任务期间发生的影响任务完成的故障。
4 故障(失效)有关的定义
- 故障:产品或产品的一部分不能或将不能完成预定功能的事件或状态。对于不可修的产品,如电子元器件和弹药等,也称为失效。故障也可以简单地定义为丧失了规定的功能。
- 故障模式∶故障的表现形式,如三极管短路或开路、灯丝的烧断等。
- 故障机理:引起产品故障的物理、化学或生物等变化的内在原因。
5 故障(失效)的分类
-
按出现故障的规律分:
偶然故障:由于偶然因素引起的故障。偶然故障是随机的,无去控制,只能通过概率统计方法来预则。
损耗故障:由于产品的规定性能道时间增加而逐渐衰退引起的。耗损故障可以统计监测,可以通过预防维修,延长使用寿命。 -
按故障的结果分:
致命性故障:完全丧失完成规定功能的能力并可能造成人或物的重大损失。
非致命性故障:不影响任务的完成,但会导致非计划的维修。 -
按故障的统计特性分:
独立故障:不是由另一产品故障引起的故障,又称原发故障。(注∶在评价产品可靠性时只统计独立故障)
从属故障:由另一产品故障引起的故障,又称诱发故障。
6 常用的度量参数
- 可靠度:产品在规定的条件下和规定的时间内,完成规定功能的概率。若产品的总数为
N
0
\ N_{0}
N0,工作到t时刻产品发生的故障数为r(t),则产品在该时刻的可靠度的观测值为:
- 故障率:工作到某时刻尚未发生故障的产品数,在该时刻后单位时间内发生故障的概率,称之为产品的故障率。
Δ r ( t ) \ \Delta r(t) Δr(t)—t时刻后, Δ t \ \Delta t Δt时间内故障的产品数;
Δ t \ \Delta t Δt—所取的时间间隔
N s ( t ) \\N_{s}(t) Ns(t)—残存产品数
例:
- 平均故障前时间(Mean Time To Failure ,MTTF):设N个不可修复的产品在同样条件下进行试验,测得其全部故障时间为t1,t2,…,
t
N
0
\ t_{N_{0}}
tN0,其平均故障前时(MTTF )为︰
当产品的寿命服从指数分布,且故障率为常数时:
例:
- 平均故障间隔时间( Mean Time Between Failure,MTBF ):一个可修产品在使用过程中发生了
N
0
\ N_{0}
N0次故障,每次故障修复后又重新投入使用,测得其每次工作持续时间为t1,t2,…,
t
N
0
\ t_{N_{0}}
tN0, 其平均故障间隔时间MTBF为:
例:
7 故障率浴盆曲线
-
早期故障期:出现于产品投入使用初期
特点:故障率高、呈迅速下降趋势
故障原因:设计缺陷或制造缺陷
消除方法:加强质量管理;老炼、筛选
-
偶然故障期:为产品平稳运行时期
特点:故障率处于较低水平,近似为常数
故障原因:偶然因素
-
耗损故障期:出现于产品投入使用较长时间后
特点:故障率迅速上升,产品故障增多
故障原因:老化、疲劳、磨损、腐蚀等
8 软件可靠性的相关概念
-
软件可靠性:软件在规定条件下和规定时间内,不引起系统失效的能力(完成规定功能的能力)。
-
软件失效原因:
-
软件缺陷的形成:
基本活动 | 现象 | 可能原因 | 缺陷性质 |
---|---|---|---|
用户需求说明 | 不符合实际需要 | 对系统认识不清楚;用户需要表达不充分;分配需求多变 | 需求缺陷 |
软件需求分析 | 不符合用户需要 | 对用户需求理解有误;需求管理有缺陷;评审不够 | 需求规格说明缺陷 |
软件设计 | 不符合用户需要;不符合需求规格说明;容错能力不够 | 对用户需要和软件需求规格说明理解不够;设计说明有误;评审不够 | 设计缺陷 |
编码 | 不满足设计要求 | 对设计说明理解不够;偶然失误;评审不够 | 编码缺陷 |
软件测试 | 覆盖率不满足要求;残留缺陷太多 | 测试设计有误;需求管理有缺陷;测试资源不够;评审不够 | 测试缺陷 |
- 软件可靠性与硬件可靠性的区别:
硬件产品 | 软件产品 |
---|---|
属于物理实体,有散差,会自然老化。且存在使用损耗 | 是思维逻辑的表示,无散差,不会自动变化,只是其载体硬件可变 |
研制生产过程的可视性好,便于控制 | 研制生产过程的可视性差,难控制 |
可靠性参数估计有物理基础 | 可靠性参数估计无物理基础 |
使用中出现故障后产品维修通常是修复失效的零部件状态,可靠性只能尽可能保持,但不能提高 | 使用中发生失效后软件维护通常要修改软件,产生新版本,只要维护过程合理,可以提高可靠性 |
9 产品安全性的相关概念
- 安全性:产品所具有的不导致人员伤亡、系统毁坏、重大财产损失或不危及人员健康和环境的能力。
- 危险:可能导致事故的状态或情况。危险是事故发生的前提或条件,可以用危险模式或危险场景来表述。
- 危险控制:保证将发生危险事件的风险保持在可接受极限水平之内的过程,包括制定待实施的工程技术和管理决策,及时实施危险减少或消除措施,并监控控制措施的有效性
- 残余危险:采取危险消除、减少等措施之后,系统虽满足安全性要求但系统中仍然存在的、不能或不打算采取进一步安全性改进措施的危险。
- 安全可靠度:在规定一系列的任务剖面中,不发生由于系统或其设备故障造成灾难性事故的概率。
常用的安全性分析方法:
安全性设计与控制方法: