预测性运维中的机器学习应从何说起？

最新推荐文章于 2023-06-08 00:15:00 发布

ELiKoMc

最新推荐文章于 2023-06-08 00:15:00 发布

阅读量686

点赞数 1

分类专栏：翻译文章标签：机器学习

原文链接：https://medium.com/bigdatarepublic/machine-learning-for-predictive-maintenance-where-to-start-5f3b7586acfb

版权

翻译专栏收录该内容

1 篇文章 0 订阅

订阅专栏

原文：Machine learning for predictive maintenance: where to start?

https://medium.com/bigdatarepublic/machine-learning-for-predictive-maintenance-where-to-start-5f3b7586acfb

在复杂的工业设备系统中，我们很难通过某几个单独的数据指标来判断设备是否即将出现故障，因此如何找到一个正确的时机进行维护是非常重要的。预测性运维使得设备零件既不会被过早地更换造成浪费，又可以避免由于设备突发性故障造成的系统停机损失。通过采集设备各项数据进行训练学习并建立机器学习模型，利用训练后的模型来预测目标设备出现故障的概率，从而进行预测性的维护，减少设备突发性故障造成的损失。

想要根据训练的模型预测结果来进行维护，预测性运维模型的准确率是最重要的，建立模型主要跟三个方面有关：1、有大量的训练数据；2、设计正确的目标问题；3、正确地评估预测性能。本文中将详述前两个方面，并描述如何针对用户想要解决的问题来选择建模的方法。

数据收集：

想要建立设备故障模型，我们需要足够的历史数据来让预测模型来捕获数据中可能导致故障的信息。除此之外，一些通用的系统信息也有一定的价值，比如设备性能、使用情况、工作条件等。然而数据并不是越多越好，当我们收集数据的时候，搞清楚这些问题是很重要的：

可能发生的故障类型有哪些？我们需要预测哪些故障？
一个故障发生的过程是什么样的？是一个缓慢老化的过程，还是一个急剧老化的过程？
设备的哪些部件可能跟哪些故障有关？这些部件可以通过测量哪些指标来反映它们的状态？多久采集一次这些指标？采集的精度有什么要求？

工业设备的生命周期一般都以年为单位，这意味着我们收集数据时需要有一个较大的时间跨度以供我们去观察设备系统老化的过程。理想的情况下，数据科学家和领域专家都参与到数据收集的过程中，这样可以保证收集到的数据都是对机器学习建模有作用的数据。然而现实中一般在数据科学家参与之前，数据已经被收集好了，因此数据科学家需要思考如何更好地利用现有的数据和根据设备系统的特性正确地设计我们想要解决的问题，这是至关重要的。

构建问题：

在构建预测性维护的模型之前，需要思考以下这些问题：

模型的输出应该是什么？
现在是否有足够的历史数据，还是说只有一些静态的数据？
是否每个记录的事件都已经打好了故障或正常的标签？
如果有已标记好的事件集合，每种故障事件和正常运行事件所占比重分别是多少？
预测模型应该提前多长时间对可能的故障事件做出预警？
优化预测模型的方向是什么？高精度(accuracy)/高精准度(precision)/高召回率(recall)。如果预测的故障没有发生或没有预测到发生的故障，会造成什么后果？

思考这些方面的问题后，我们才能开始选择最适合目标问题和现有数据集的建模策略，或是选择最合适的已有原型作为基础。针对预测性运维常见的目标问题，我们这里介绍四种建模策略和具体的问题。