目标综述
这篇文章的主要目的是记录我的一个模型的实现,该模型可用于对商用涡扇发动机进行预测维护。这里使用的预测维护方法是一种数据驱动方法,这意味着从运行中的喷气式发动机收集的数据用于执行预测维护建模。具体来说,该项目的目标是建立一个预测模型,基于类似喷气式发动机集群从运行到故障的数据,以估计剩余使用寿命(RUL)的喷气发动机。本文所述的算法基本遵循[1]。
数据集概述
NASA已经创建了预测和健康管理PHM08挑战数据集,并向公众开放。该数据集用于预测喷气发动机随时间的故障。数据集由NASA艾姆斯的预测中心提供数据集包括各种压力、温度和喷气发动机旋转设备速度的时间序列测量。这些测量通常是在商用现代涡轮风扇发动机中进行的。所有的发动机都是同一类型,但每个发动机的启动初始磨损和变化程度不同。这是用户所不知道的。
Prognostics Center - Data Repositoryti.arc.nasa.gov- 可以使用三个可选设置来更改每台发动机的性能。
- 每个发动机都有21个传感器,在运行时收集与发动机状态相关的不同测量值。
- 模拟了六个不同的飞行条件,其中包括三种运行条件的值范围:高度(0–42K ft。),马赫数(0–0.84)和油门旋转角(TRA)(20–100)。
请参阅发动机示意图以及各种传感器测量位置的图片。
采集的数据被传感器噪声污染。随着时间的推移,每台发动机都会出现一个故障,这一点可以通过传感器读数看出来。当特定引擎发生故障时,每个引擎的数据将停止。因此,实际的RUL是根据数据的长度来确定的。数据实际上是使用C-MAPSS(商用模块化航空推进系统仿真)模拟的数据。所生成的模拟数据被用作第一届预测与健康管理(PHM)数据竞赛(PHM 08)的挑战数据。
有关数据集的更多详细信息,请参见飞机发动机从运行到故障模拟的损伤传播建模:
当前的问题是提出一个基于传感器测量的时间序列数据的机器学习模型来预测RUL,这些数据通常来自飞机燃气轮机。
解决方案策略
- 主要策略是使用数据集训练回归模型来预测RUL。 由于数据是许多传感器数据的时间轨迹形式,因此需要将这些传感器数据融合到状态指示器或健康指标中,以帮助识别故障的发生。
- 测试模式下的模型将比较测试融合信号与训练融合信号的相似度/相关度。 基于该相似度比较,进行预测。
由于训练数据由run-to-failure轨迹组成,而测试数据包含未定义的健康状态轨迹,然后训练过程将包括训练的模型部分发生故障前的轨迹模拟真正的使用模型的在线预测模式。
单元是根据具有最相似退化模式的训练单元的实际寿命来估计的。
数据挖掘
本文分析使用的数据是仿真数据的一部分,具体文件为:train FD001.txt。这个特定的数据集包含100个从运行到故障的引擎模拟(对应100个不同的引擎):