2013年下午试题1分析与解答
试题三
故障(失效)模型影响分析FMEA是分析产品所有可能的故障模式及其可能产生的影响,并按每个故障模式产生影响的严重程度及其发生概率予以分类的一种归约分析方法。近年来,FMEA方法已被广泛用于安全关键系统的嵌入式软件可靠性分析工作。
某软件公司承担了一项通信软件的开发项目。该项目由FC系统、DY系统和GD系统组成,而DY系统(TMS320C25S)软件负责按系统的通信协议完成与FC系统的通信,图3-1给出了该通信软件的约定层次图。公司高层将项目交给王工,王工认为比项目是安全关键系统,安全等级应为II类(致命的),因此应开展软件的FMEA分析。
【问题1】
请阅读以下有关FMEA的描述,将恰当的内容填入(1)〜(7)。
FMEA是FMA(故障模式分析)和FEA(故障影响分析)的组合,它对系统各种可能的风险进行评价、分析后,在现有技术的基础上消除这些风险或将这些风险降低到可接受的水平。为达到最佳效益,FMEA必须在产品研制初期进行。
FMEA实际是一组系列化的活动,其主要活动包括:
(1) ;
(2) ;
(3) 。
由于产品故障可能与设计、制造过程、使用、承包商/供应商以及服务孖关,因此FMEA又细分为(4)FMEA、(5) FMEA、(6) FMEA和__(7}_FMEA四类。
(1)找出产品/过程中潜在的故障模式
(2) 根据相应的评价体系对找出的潜在故障模式进行风险量化评估
(3) 列出故障起因/机理,寻找预防或改进措施
(4) 设计
(5) 过程
(6) 使用
(7) 服务
本问题主要考查考生对FMEA的理解程度。在做FMEA分析之前考生必须清楚三种主要活动,其一是分析系统或产品有可能存在故障模式,其二是对每一种故障模式开展风险评估(量化分析),其三对故障机理进行分析,制定出预防和改进措施。风险评估可采用多种方法,对软件而言,严酷度等级(SESR)、发生概率等级(SOPR)和被检测难度等级(SDDR)是评估的主要评价参数,这些等级通常以经验或专家评判方法获取。考生应该清楚,FMEA方法可适用产品整个生命周期的各类活动,不同活动可采月不同的评估方法。通常存在四种FMEA,设计FMEA、过程FMEA、使用FMEA和服务FMEA。
【问题2】
从图3-1可以看出,CSU01通信模块是该项目的关键模块,主要功能定义为:总线通信控制器自动完成一帧数据的接收,存入数据缓冲区,并产生中断(INTO),通知CPU从数据缓冲区中读取数据;CPU读完数据后,将准备好的发送数据写至数据缓存区,写完后通知总线通信控制器自动完成一帧数据的发送。CRC校验由外部电路完成判别,其结果通过数据线上的相应位进行标识。针对CSU01通信模块,简要描述实施FMEA的具体内容,填写完成表3-1的(1)〜(5)。
(1) 根据通信协议,可按接收数据功能和发送数据功能分别确定故障模式;
(2) 故障原因分为总线通信控制器原因、对方发送的原因和自身程序的原因;
(3) 针对每个故障模式分析其对本模块直至整个DY系统造成的影响;
(4) 采用风险优先数RPN方法进行该通信模块的危害性分析;
(5) 根据以上故障模式、原因、影响及危害性的分析结果,综合考虑故障的影响及SRPN值等情况,对每个故障模式制定了相应的改进措施。
给出了CSU01通信模块的工作原理,考生可根据自己原先掌握的嵌入式数据采集的基本工作经验,回答出FMEA分析工作5个步骤中具体内容。回答的要点可以这样考虑如下:
(1) 影响数据交换的主要失效原因不外乎发生在输入(接收)、输出(发送)操作上,因此可从这两方面入手;
(2) 故障原因分析可将产生故障的点定位在三方面,即硬件控制器、发送方和自身缺陷;
(3) 故障影响分析,按照FMEA的分层思想,根据3-1结构,影响范围可以包括对本软件模块(INT0-ISR)的影响、对上一层软件(DY软件)的影响和对最终DY系统的影响;
(4) 危害分析和改进措施,软件FMEA通常采用风险优先数RPN方法分析,改进措施通常就是根据危害性分析结果和风险优先数等情况,逐一对故障模式制定改进措施。
如果清楚了问题1和问题2所给出一些分析概念的话。
【问题3】
表3-2给出针对该项目的CSU01通信模块的软件故障(失效)模型影响分析FMECA表(局部),请根据此题描述情况填写表3-2中的(1)〜(7)。
注:表3-2中的SRPN(软件风险优先数)=SESR(软件故障模式的严酷度等级)XSOPR(软件故障模式的发生概率等级)XSDDR(软件故障模式的被检测难度等级)。
(1) 程序写0C300H地址单元不当
(2) 无法响应INTO中断
(3) 线路误码
(4) 通信错误
(5) 程序控制错误
(6) 210
(7)数据发送始终不成功数据发送始终不成功
只要有实践经验,可通过表3-2中的相关信息正确判断出相应内容。这里要说明的是故障模式5由于其软件风险优先数(SRPN)很高(336),在设计时应重点关注。