既然嵌入式系统设计各个地方都可能发生失效,那么如何设计出高可靠性系统?
系统可靠性理论上可以预测、测量,通过产品结构,各部件的可靠性,根据可靠性建模(串联还是并联),预测系统可靠性。但事实上,情况非常复杂,部件可靠性不是那么容易预测出来,因为问题需要迭代下去。
系统可靠性测量可以通过模拟运行环境,长时间运行,得到系统可靠性数据。但是可靠性指标一般部件时间都是以上万小时计算,而且也存在不同测试件存在随机差异。系统可靠性数据获取难道较大。工业基础越低,可靠性数据就越不准确。做好可靠性分析就需有各种零部件的基础数据,这些数据可以通过仿真分析或试验获得,建模底层可靠性依据是故障物理模型。事实上更方便可靠的方法是通过长时间积累出来的数据。
当分析出产品可靠性不满足,设计要求的情况,我们怎么办?
1,降额设计,提升部件可靠性。通过降额设计降低产品受到应力,提高可靠性。比如继电器原来通过10安培,我们设计选用额定电流更大的继电器。原来结构件本来厚度10mm,现在设计采用20mm。
2,增加防护性设计,给产品一个良好的运行环境。这里面有很多工作要做,比如增加减震器,降低产品结构强度刚度要求,增加三防设计,减少化学腐蚀。增加滤波电路,防止外部干扰影响逻辑,或加强了电应力。采取电磁屏蔽,减少信号干扰。加强热分析,加上散热措施,提升电子部件可靠性。
3,通过容错架构,提升产品任务可靠性。通过容错,一个部件出现问题另外部件顶上去运行。就像重要岗位,一个人生病不能上班,我们让另外一个人顶班一样。飞机飞行控制,高铁上的控制,卫星设备,都采用了容错架构,容错架构有备份,三余度,四余度等等。也有像电梯控制系统,一旦失效坠落,可以通过继续安保环节,保障乘客安全。
4,不能在产品上增加可靠性,可以增加健康管理,或增加维护维修使用要求,来确保系统可靠。有很多重要的嵌入式系统,需要定期维护维修要求。实际上是,确保产品可靠性。特别是机械部件部分都要求定期维护,定期更换部件,定期更换滑油等。更先进方式是设置健康管理监控,在信息技术支持下完成维护,确保故障前产品能检查出故障可能发生,保障后续继续正常运作。