【文献笔记】A cost model for predictive maintenance based on risk-assessment

最新推荐文章于 2024-07-05 15:51:51 发布

小马驹Tony

最新推荐文章于 2024-07-05 15:51:51 发布

阅读量90

点赞数

文章标签：笔记

本文链接：https://blog.csdn.net/wdjkdbndxdhw/article/details/132494737

版权

RIM LOUHICHI, MOHAMED SALLAK, JACQUES PELLETAN

摘要：工业系统日益复杂，促使公共和私人决策者优化系统的生命周期，特别是在维护操作(maintenance operations)方面。在本文中，我们提出了一种优化和规划维护策略的方法，同时考虑了运营成本和与系统故障相关的风险。所提出的方法的新颖性在于，在我们最小化的目标函数中，集成了一组维护成本以及可能由系统故障引起的财务、环境和人力风险。这是基于系统的剩余使用寿命（RUL）作为系统健康状态的指标。决策变量是：RUL的临界阈值，低于该阈值，部件将被更换，检查步骤给出了检查系统的规律性(regularity)。

1 Introduction

维护是系统生命周期中所有技术(technical)、行政(administrative)和管理行动(managerial actions)的结合，旨在将其保持或恢复到能够执行其所需功能的状态。我们区分不同类型的维护，例如纠正性维护(corrective maintenance)，这是在检测到故障后进行的维护；以及以预定间隔执行的预防性维护(preventive maintenance)，旨在降低系统故障或退化的概率。这两种类型的维护有主要缺点：纠正性维护会产生额外的成本和显著的系统停机时间，而预防性维护不允许最佳的系统运行。为了克服这些缺点，预测性维护(predictive maintenance)已经成为减少系统停机时间和维护系统成本的解决方案。预测性维护是基于对系统的定期监测，以评估其组件的健康状态(components)。预测性维护是根据对系统退化的重要参数的重复分析或已知特性和评估得出的预测进行的。通常，我们使用剩余使用寿命（RUL），定义为系统故障前的预期剩余时间长度，作为系统健康状态的衡量标准。

通过预测性维护，工业界现在可以估计系统的RUL，作为预测系统故障时间的其他措施之一，以便工业界能够在系统故障之前对其进行维护。然而，在实践中，一旦确定了系统健康状态的RUL或其他指标，工业企业就面临着与决策过程相关的几个问题：执行预测性维护的最佳时间是什么？以及我们如何优化维护的总成本？

此外，系统的突然故障可能会导致重大事故，对人类和环境造成损害。工业界面临的主要挑战是量化这些可能事故的影响，以便实施成本效益高的维修策略。

在本文中，我们试图通过提出一种方法来回答以上问题，该方法允许确定预测性维护的成本最优策略，同时考虑故障事故可能对系统及其周围环境造成的可能影响。

2 State of the art

引入新的维护策略，如预测性维护，主要是因为工业系统的复杂性增加，以及维护可能对环境、设备安全、人员安全和经济盈利能力产生的影响的重要性。例如，最近，我们目睹了在维护中使用风险度量(risk measures)。在本文中，在第一近似中(in first approximation)，风险被认为是系统发生故障的概率和系统及其周围环境发生故障的后果的乘积，然后被用作一种指标衡量标准，以明确风险维护技术的优先级。考虑决策者对风险的态度的替代标准是未来研究的途径。

基于风险的维护（RBM）是一种识别、表征、量化和评估故障事件损失的技术，目的是计划维护行动。RBM首先部署在化工和炼油领域。例如，[Aller等人，1995]和[Rynolds，1995]的工作被用于为文莱壳牌石油公司拥有的设备制定基于风险的检查政策。[Dey等人，1998年]使用了一种简单的RBM来维护跨国管道。[Nessim et Stephen，1998]为维护预算制定了定量风险分析模型，而[Dey，2001]为跨国管道的基于风险的检查和维护制定了更通用的框架。

根据[Khan et Haddara，2003]，基于风险的方法可分为三个主要模块：由风险识别(risk identification)和风险估计(risk estimation)组成的风险确定(risk determination)，由风险规避(risk aversion)和风险接受分析(risk acceptance analysis)组成的风险评估(risk evaluation)，以及考虑风险因素的维护计划。该方法已成功应用于暖通空调系统。

[Sakai, 2010] 确定了RBM的一般程序。在本通用程序中，收集数据并用于评估所研究系统各部分的风险。风险评估将作为零件检验优先级排序的基础。因此，提出了缓解措施(mitigation measures)，如果发现问题，则从一开始就重复操作。

[Leoni等人，2018] 开发了一项关于RBM与贝叶斯网络相结合的风险及其相关不确定性建模的最新工作，并成功应用于意大利天然气还原和测量站的案例研究。最后，[Jaderi等人，2019]的工作考虑了传统RBM和模糊RBM对石化资产失效的风险分析。

对RBM文献的审查表明，风险度量(risk measures)可以作为计划维护的标准。然而，在实践中，界定风险接受程度并不明显，而风险接受程度是RBM的基础。此外，风险的概念不能排除在货币损失的概念之外，因为工业的最终目标是降低总体维护成本。

文献中广泛使用的另一种维护计划方法是成本优化方法。该方法旨在确定维护策略，最大限度地降低维护的总成本。例如，[Vaurio，1999]开发了一个成本模型，该模型考虑了有限的维修、维护持续时间和由于测试、维修、维护和生产损失或事故而产生的成本。维护优化的目标是通过适当选择两个间隔来最大限度地降低总成本率：一个用于检查，一个用于更换[Vaurio，1999]。[Maillart et Pollock，2002]分析了表现出两阶段行为的系统的预测性维护策略：新状态阶段和磨损状态阶段，并提出了成本最小化策略，以确定何时进行监控。[Zou et al.，2007]和[You et al.，2010]制定了一个连续的不完美预防性维护(imperfect preventive maintenance)策略，并确定了在系统生命周期或长期内将成本率降至最低的最佳预防性维护时间表，而[Van Horenbeek et Pintelon，2013]为复杂的多组分系统开发了一种动态预测维护策略，旨在最大限度地降低单位时间的长期平均维护成本。最后，[He et al.，2018]开发了一种基于网络制造和任务可靠性状态的预测性维修决策方法。

对维护成本优化方法文献的回顾表明，成本优化中的风险概念尚未得到解决，尽管系统故障的发生可能会给工业带来沉重的后果。

为了解决这一差距，我们在本文中提出了一种独创的方法，允许将风险的概念与维护成本相结合，以从经济利润的角度确定最佳维护策略。

3 Cost model

3.1 Assumptions

在制定预测性维护策略时，一些假设如下：

所研究的系统是一个单一的部件
研究中的系统是一个复杂系统的一部分，这个系统的开发时间是事先已知的，记为 $D$
定期对系统进行完全可靠的检查（图1）。检查提供了有关系统运行状况的信息。例如，检查给出了系统RUL的真实估计。模拟后，RUL是系统在需要更换之前可能运行的预期时间间隔。系统的RUL可以由以下式子表示： $RUL(t)=E[T-t|T>t]=\frac{\int_{t}^{\infty }(u-t)f(u)du}{S(t)}$ ，
其中 $T$ 为系统发生失效的时间(the time of failure of the system)， $f$ 为系统失效密度函数， $S$ 为系统生存函数
检查不会影响系统的性能
在系统的早期需要进行第一次检查，但系统的健康状况不需要更换，因为它是一个新的系统（图1）。一旦系统达到 $D$ ，就没有必要进行检查，可以用新的系统更换系统
在检查 $i$ 和检查 $i+1$ （图1）之间，发生以下场景之一：（1）预测性维护场景：系统的RUL达到某个称为 $RUL_{lim}$ 的阈值，在此阈值下，系统被视为已退化：在检查 $i+1$ 之前，系统被新的系统替换。（2）非预测性维护场景：在这种场景中，系统不会被预测性维护所取代。在这种情况下，系统可能会发生故障，也可能不会：①在检查 $i$ 时系统可以运行，在检查 $i+1$ 之前失效，然后用新的系统正确地替换系统。这种情况发生的概率由下式给出： $\int_{i,T>t_{i}}^{i+1}f(t)dt=\frac{\int_{i}^{i+1}f(t)dt}{S(t_{i})}$ ，其中 $t_{i}$ 是第检查 $i$ 的时间。②系统正常运行，直到下一次检查 $i+1$ ，具有互补的发生概率 $1-\int_{i,T>t_{i}}^{i+1}f(t)dt$
预测性和纠正性替换的持续时间均假定为恒定且已知
假设预测性和纠正性更换的成本以及检查成本是恒定的且已知的

3.2 Typology of costs

在我们的方法中，成本可分为两种类型，如图2所示：与维护相关的成本包括：预测性维护成本、纠正性维护成本以及检查成本和维护系统造成的经济损失。经济损失包括经营损失成本和间接损失成本（图2）。

3.3 Cost of predictive maintenance

在我们的方法论中，预防性维护系统的决策是不系统的。事实上，在某些情况下，纠正性维护可能比预测性维护更可取。

时间周期 $D$ 期间的预测性维护成本，表示为 $C_{pm}$ , 可以用下面的方程式来描述：

$C_{pm}=\left ( C_{p}+C_{I} \right )\sum_{i=1}^{N_{In}-1}N_{i}$ (1)

其中 $C_{p}$ 是系统的预测性更换(predictive replacement)的成本， $C_{I}$ 用于维护的安装成本（固定成本）， $N_{In}$ 是检查的总数（第一个检查不引起任何替换）， $N_{i}$ 是检查间隔 $[i,i+1]$ 中的二元决策变量，在预测性维护的情况下取1（RUL低于阈值 $RUL_{lim}$ ），在其他情况下取0。

3.4 Cost of corrective maintenance

只有在没有预测性更换以及在下一次检查（检查 $i+1$ ）之前出现故障的情况下，才支付第 $i$ 次检查的纠正性维护费用。因此，时间周期 $D$ 期间的纠正性维护成本，表示为 $C_{Cm}$ , 可以通过以下等式来描述：

$C_{Cm}=\sum_{i=1}^{N_{In}-1}\left ( C_{C}+C_{I} \right )\left ( 1-N_{i} \right )\int_{i,T>t_{i}}^{i+1}f(t)dt$ (2)

其中 $C_{C}$ 系统纠正性更换的成本。

3.5 Inspection cost

定期对系统进行检查，以评估所研究系统的RUL（图1）。我们规定，在系统的早期生命周期中需要进行检查。根据图1，根据以下等式，检查步骤 $\theta$ 与每个周期 $D$ 的检查次数 $N_{In}$ 相关联：

$N_{In}\cdot \theta =D$

这也就是说：

$N_{In}=\frac {D}{\theta }$ (3)

因此，每个时间周期 $D$ 内总检查费用 $C_{In}$ 可以由以下等式表示：

$C_{In}=\frac{D}{\theta }c_{In}$

其中 $c_{In}$ 表示一次检查的费用。

3.6 Cost of operating loss

通常情况下，系统的故障会导致运营能力的丧失(operation capacity)。此外，维护系统可能需要关闭系统以采取安全措施，从而导致系统运行能力的损失。

经营损失成本 $C_{Ol}$ 包含预测性维护的运营损失成本和纠正性维护的运行损失成本。该成本可以通过以下等式进行建模：

$C_{Ol}=D_{p}\cdot c_{Dt}\cdot \sum_{i=1}^{N_{In}-1}N_{i}+\sum_{i=1}^{N_{In}-1}\left ( 1-N_{i} \right )\cdot \int_{i,T>t_{i}}^{i+1}f(t)dt\cdot c_{Dt}D_{c}$

其中 $D_{p}$ 是预测性替换的持续时间， $D_{c}$ 是纠正性替换的持续时间， $c_{Dt}$ 是每单位时间的系统停机成本。

如前所述，方程的第一项对应于预测性维护引起的运营损失的成本，方程的第二项对应于纠正性维护造成的运营损失成本。

3.7 Indirect loss cost

在现实中，运营能力的丧失可能会对客户满意度产生负面影响，从而间接给公司带来经济损失，如公司地位下降等因素导致订单减少。此外，故障事件的发生可能对人类健康和环境产生负面影响。例如，系统故障可能会导致有毒化学物质的排放，对人类健康和环境有害。

因此，间接损失成本包括以下条目：

由客户订单减少引起的财务风险 $R_{f}$
由故障事件造成的人员损失（受伤、疾病或死亡）导致的人员风险 $R_{h}$
由于污染物排放造成的环境退化所造成的环境或生态风险 $R_{e}$

间接损失成本，表示为 $C_{Il}$ 则可以由以下等式表示：

$C_{Il}=R_{f}+R_{h}+R_{e}$ (6)

在下一节（第4节）中，我们描述了如何衡量第4.1节中的财务风险、第4.2节中的环境风险和第4.3节中的人类风险。

4 Risk assessment

基于风险的方法的基础来自于对失效场景、其后果和发生概率的识别。故障场景是一系列可能导致系统故障的事件。它可以是单个事件，也可以是连续事件的组合。在预测性维护的背景下，系统故障可能性的估计是基于检查和模拟的。为了评估失效场景的风险，我们使用了风险的经典定义：在一阶近似(first approximation)中（即不考虑决策者的风险相关的行为），对于一个已经预定义的失效场景，风险可以定义为以下二重组：

$Risk=probability\, of\, failure\times consequence\, of\, failure$

4.1 Financial risks

文献综述提出了各种各样的财务指标，可以用来评估一个行业的财务业绩：例如，在最基本的水平上，增长率用来表示变量的年度变化百分比，利润率用来评估在考虑销售商品成本或每个用户的平均收入后剩余的货币收益。在我们的研究中，我们提倡使用流失率(churn rate)作为财务指标，因为它可以建模财务损失。流失率的基本定义是企业在给定时间段内失去的客户比例。

在我们的研究中，我们假设在预测性维护的情况下，企业损失了x%的客户，在纠正性维护的情形下，企业失去了y%的客户。正如人们可能注意到的那样，y%大于x%，因为系统的故障对消费者来说是负面的。

我们知道在时间段 $D$ 中，系统发生预测性维修的次数为 $\sum_{i=1}^{N_{In}-1}N_{i}$ ，发生纠正性维修的次数为 $\sum_{i=1}^{N_{In}-1}\left ( 1- N_{i}\right )\int_{i,T>t_{i}}^{i+1}f(t)dt$ 。因此，预期的财务风险可以通过以下等式来评估：

$R_{f}=M\cdot C\cdot \frac{1}{100}\left ( x\times \left ( \sum_{i=1}^{N_{In}-1}N_{i} \right )+y\times \left ( \sum_{i=1}^{N_{In}-1}(1-N_{i}) \right ) \int_{i,T>t_{i}}^{i+1}f(t)dt)\right )$ (7)

其中 $M$ 是时段 $D$ 开始时的潜在客户数量， $C$ 是企业失去一个客户的成本。

4.2 Environmental risks

故障情况可能会因排放有害污染物而对环境造成损害。对于故障场景 $i$ ，我们考虑：

$n$ ：故障场景 $i$ 期间排放的化学物质总量
$P=\left ( P_{1},P_{2},\cdots ,P_{n} \right )$ ：污染物排放的概率，从而 $P_{j}$ 是故障场景 $i$ 中化学物质 $j$ 的排放概率
$V=\left ( V_{1},V_{2},\cdots ,V_{n} \right )$ ：污染物的排放量，从而 $V_{j}$ 是失效情景 $i$ 期间化学物质 $j$ 的排放量
$\rho =\left ( \rho_{1},\rho_{2},\cdots ,\rho_{n} \right )$ ：化学物质的密度向量，因此 $\rho_{j}$ 是失效场景 $i$ 期间排放的化学物质 $j$ 的密度值
$D_{a}=\left ( D_{a1},D_{a2},\cdots ,D_{an} \right )$ ：每吨污染物排放的损害成本，因此 $D_{aj}$ 是失效情景 $i$ 期间每吨化学品 $j$ 排放的损害成本

有几种方法可以评估污染物的损害成本。例如，残疾调整生命年（DALYs）用于通过测量年内疾病导致的生活质量下降来评估环境对人类健康的影响。疾病的环境负担（EBD）评估可归因于环境风险因素的疾病负担，而欧洲清洁空气计划（CAFE）使用的CAFE-CBA方法是一种成本效益分析方法，目的是量化一些化学物质对作物和人类健康的损害。

环境风险通过考虑预期的故障数量，可以通过以下等式来评估故障场景 $i$ ：

$R_{e}=\left ( \sum_{j=1}^{n}P_{j}V_{j}\rho_{j}D_{aj} \right )\sum_{i=1}^{N_{In}-1}\left ( 1-N_{i} \right )\int_{i,T>t_{i}}^{i+1}f(t)dt$ (8)

其中 $D_{aj}$ 是通过考虑前面描述的损害成本评估方法之一，每吨污染物 $j$ 排放的损害成本。

4.3 Human risks

很难评估金融领域之外的风险。生命和健康风险通常与金融风险不同，因此不能用金钱来评估。为了解决这一问题，经济学家们引入了统计生命价值（VSL）的概念。VSL是指死亡风险和金钱之间的权衡率的最常见术语。它反映了工人愿意承担风险并为更多的安全付出代价。VSL的术语强调估价的概率方面，因为在做出决定时，将要挽救的生命只是概率已知的。

VSL具有吸引人的特性：它提供了生命价值的基本衡量标准，而不是顺序衡量标准，并用于估计支付价值的意愿以及接受风险变化价值的意愿。设 $p_{j}^{d}$ 为失效场景 $i$ 情况下人员 $j$ 的死亡概率，通过考虑预期的故障数量，可以通过以下等式来评估人为风险：

$R_{h}=\left ( VSL\cdot \sum_{j=1}^{n} p_{j}^{d}\right )\cdot \sum_{i=1}^{N_{In}-1}\left ( 1-N_{i} \right )\int_{i,T>t_{i}}^{i+1}f(t)dt$ (9)

其中 $n$ 是可能受到失效场景 $i$ 影响的总人数。

通过相似性，该方法可用于评估人类伤害的风险：我们可以考虑不同程度的伤害及其相应的赔偿成本。

在实践中，专家无法确定故障场景中的伤亡概率。他们也无法评估化学品排放的可能性。因此，不确定性减少的方法(methods for uncertainty reduction)被用来近似估计这些概率（附录1）。

5 Cost model based on risk assessment

在本节中，我们将描述要遵循的优化过程，以确定预测性维护的最佳策略。第5.1节定义了优化目标函数，第5.2节描述了决策变量，第5.3节描述了约束条件。最后，在第5.4节中描述了优化过程步骤的综合。

5.1 Objective function

我们想要最小化的目标函数是时间 $D$ 期间的维护总成本。该目标函数由以下方程给出：

$\textit{Objective function}=C_{Pm}+C_{Cm}+C_{In}+C_{Ol}+C_{Il}$ (10)

5.2 Decision variables

我们需要通过优化过程确定的决策变量如下：

$RUL_{lim}$ ：指示应当对系统执行预测性维护的RUL的极限。意思是：①如果 $RUL_{system}\leq RUL_{lim}$ ，则应当维护该系统；②如果 $RUL_{system}> RUL_{lim}$ ，则该系统正常运行并且不需要维护。
$\theta$ ：检查步长，即两个连续检查之间的间隔。

5.3 Constraints

正值约束，成本应该是正的：

$\left\{\begin{matrix}C_{Pm}\geq 0 \\ C_{Cm}\geq 0 \\ C_{In}\geq 0 \\ C_{Ol}\geq 0 \\ C_{Il}\geq 0 \end{matrix}\right.$ (11)

并且决策变量需要验证以下约束：

$\left\{\begin{matrix}N_{i}\textit{ binar} y,i=1,\cdots ,N_{In}-1 \\ \theta \geq 0 \end{matrix}\right.$ (12)

检查过程的约束，该系统至少需要一次检查：在系统早期进行一次检查。这可以通过以下不等式来转换：

$N_{In}\geq 1$ (13)

系统可用性约束，我们必须确保系统的可用性，这意味着与系统的运行时间相比，维护操作应该可以忽略不计。换句话说，与检查步长 $\theta$ 相比，预测性和纠正性更换的持续时间都应该小到可以忽略不计：

$\left\{\begin{matrix}D_{p}\leq \varepsilon \theta \\ D_{c}\leq \varepsilon \theta \end{matrix}\right.$ (14)

其中 $\varepsilon$ 是足够小的数。

5.4 Synthesis

对系统的第 $i$ 次检查给出了系统的健康状态数据，特别是在时刻 $t_{i}$ （检查 $i$ 发生的时刻）的RUL的度量。在时刻 $t_{i}$ 我们需要决定是否应该对系统进行预测性维护。因此，我们采取以下措施：

评估系统可能发生故障所造成的不同风险
评估与维护相关的不同成本
确定决策变量，使总体维护成本最小化

一旦对决策变量进行了评估，我们就会遇到几种可能的情况：

决策变量 $N=1$ ，执行系统的预测替换并且 $RUL_{system}\leq RUL_{lim}$ ，在这种情况下，一旦系统被新系统替换，必须重置该过程。
决策变量 $N=0$ ，因此不存在系统的预测性替换。但是，在下一次检查（检查 $i+1$ ）之前，系统可能会失效：①系统在检查 $i+1$ 之前没有失效：系统继续正常运行，在时刻 $t_{i}+\theta$ 执行检查 $i+1$ ；②系统在检查 $i+1$ 之前失效：应该执行系统的纠正替换，并且一旦系统被新的系统替换，就重置该过程。

图3显示了本文开发的整体方法的流程图。

6 Conclusion and future perspectives

维护旨在提高系统的可用性，同时考虑与安全和环境相关的问题，并考虑成本优化问题。风险评估试图回答以下问题：

什么会导致系统故障？
系统故障可能造成什么影响？
它发生的可能性有多大？

而成本优化则试图回答以下问题：

关于风险评估，不同的维护成本是多少？
如何最大限度地降低维护的总成本，换句话说：为了最大限度地减少维护的总费用，进行检查/维护的最佳时间是什么？

在本文中，我们试图通过提出一种考虑风险评估的维护策略优化的原始方法来回答前面的问题。然而，这种方法需要进行一些可能的改进：

概率估计中的不确定性：事实上，决策者无法确定地评估故障场景可能造成的损坏的概率。因此，一种减少不确定性的方法可以集成到我们的方法中（附录1）。
决策者对风险和不确定性的态度：在现实中，决策者是否厌恶风险或不确定性对优化过程有着巨大的影响。将决策者对风险和不确定性的态度整合到我们的方法中可能会很有趣（见附录2中的示例）。

我们未来的工作将尝试发展这两点，作为改进本文所述方法的可能途径。

小马驹Tony

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
【文献笔记】A cost model for predictive maintenance based on risk-assessment

摘要：工业系统日益复杂，促使公共和私人决策者优化系统的生命周期，特别是在维护操作(maintenance operations)方面。在本文中，我们提出了一种优化和规划维护策略的方法，同时考虑了运营成本和与系统故障相关的风险。所提出的方法的新颖性在于，在我们最小化的目标函数中，集成了一组维护成本以及可能由系统故障引起的财务、环境和人力风险。这是基于系统的剩余使用寿命（RUL）作为系统健康状态的指标。
复制链接

扫一扫