平方预测误差(Squared prediction error，SPE)和霍特林统计量（Hotelling’s T2）原理

最新推荐文章于 2023-10-14 17:25:43 发布

府学路18号车神

最新推荐文章于 2023-10-14 17:25:43 发布

阅读量1.4w

点赞数 14

分类专栏：算法文章标签：数据分析人工智能算法 SPE T2

本文链接：https://blog.csdn.net/weixin_44333889/article/details/119449882

版权

算法专栏收录该内容

36 篇文章 62 订阅

订阅专栏

读Paper读的头炸（原因：太菜），坚持每天简单通俗总结一下！

故障检测是多变量过程监控的第一步。

通常，SPE（或Q-统计量）和霍特林的T2指数分别用于监测RS和PCS的正常变异性。

应注意的是，PCA或PLS建模不要求数据为高斯分布。高斯假设仅用于推导故障检测指数的适当控制限值。此外，在推导控制限值时，不需要样本的时间独立性，因为仅指定I类错误来控制假警报率。当涉及II类错误时，监测测量的时间独立性是必要的，即未检测到的故障率。

当测量值假设为高斯分布时，通常适合使用马氏距离来定义故障检测的正常区域，例如，在主分量子空间中。然而，由于过程数据通常高度相关，这使得剩余分量的方差接近于零，因此在RS中使用马氏距离将是病态的。因此，Q统计量或SPE使用欧几里德距离来定义故障检测的正常区域。由于这两个指标的互补性，还提出了用于故障检测和诊断的组合指标。

以下，我总结了这些故障检测指标。

平方预测误差(Squared prediction error，SPE)

SPE指数测量样本向量在剩余子空间上的投影，

$\mathrm{SPE} \equiv\|\tilde{\boldsymbol{x}}\|^{2}=\left\|\left(\mathbf{I}-\mathbf{P} \mathbf{P}^{T}\right) \boldsymbol{x}\right\|^{2}\tag{1}$

如果出现以下情况，则该过程视为正常

$\mathrm{SPE} \leqslant \delta^{2}\tag{2}$

其中 $\delta^{2}$ 表示SPE的控制限值。Jackson和Mudholkar（1979）提出了控制极限 $\delta^{2}$ 的表达式，该表达式近似于三阶矩的SPE分布。

当故障发生时，故障样本向量 $\mathbf{x}$ 由与故障部分叠加的正常部分组成。故障会使SPE大于 $\delta^{2}$ ，从而导致检测到故障。

霍特林统计量（Hotelling’s T2）

Hotelling的 $T^2$ 测量了在主分量（PCS）中的变化，

$T^{2}=\boldsymbol{x}^{T} \mathbf{P} \boldsymbol{\Lambda}^{-1} \mathbf{P}^{T} \boldsymbol{x}\tag{3}$

在正态数据服从多元正态分布的情况下， $T^2$ 统计量与 $F$ 分布有关

$\frac{N-l}{l(N-1)} T^{2} \sim F_{l, N-l}\tag{4}$

如果数据点的数目N较大，则 $T^2$ 指数可以很好地近似于具有 $l$ 个自由度的 $\chi^2$ 卡方分布，即，

$T^{2} \leqslant \chi_{l}^{2}\tag{5}$

在正常情况下。在过程监控中，通常情况下，N非常大。因此， $\chi^2$ 控制限值是足够的，并且经常在过程监控文献中使用。

当来自过程数据的分数不符合多元正态性假设时， $T^2$ 的限值在实践中是不可靠的。相比之下，残差的表现要好得多。

综合指标（Combined Indices）

在实践中，有时最好使用一个指标而不是两个指标来监控流程。

有的论文中建议采用组合统计，但不给出控制限。

也有论文，如在Yue和Qin（1998）、Yue和Qin（2001）中，提出了一种用于故障检测的组合指标，它将SPE和 $T^2$ 结合在一起，如下所示：

$\boldsymbol{\varphi}=\frac{\operatorname{SPE}(\boldsymbol{x})}{\delta^{2}}+\frac{T^{2}(\boldsymbol{x})}{\chi_{l}^{2}}=\boldsymbol{x}^{T} \mathbf{\Phi} \boldsymbol{x}\tag{6}$

其中，

$\mathbf{\Phi}=\frac{\mathbf{P} \mathbf{\Lambda}^{-1} \mathbf{P}^{T}}{\chi_{l}^{2}}+\frac{\mathbf{I}-\mathbf{P} \mathbf{P}^{T}}{\delta^{2}}\tag{7}$

注意， $\mathbf{\Phi}$ 是对称的和正定矩阵。

前辈大佬得出的控制极限，该结果提供了一个近似分布，其前两个矩与精确分布相同。作为二次指数， $\mathbf{\Phi}$ 近似如下：

$\varphi=\boldsymbol{x}^{T} \mathbf{\Phi} \boldsymbol{x} \sim g \chi_{h}^{2}\tag{8}$

其中系数

$g=\frac{\operatorname{tr}(\mathbf{S} \Phi)^{2}}{\operatorname{tr}(\mathbf{S} \Phi)}\tag{9}$

以及 $\chi^2$ 分布的自由度
$h=\frac{[\operatorname{tr}(\mathbf{S} \Phi)]^{2}}{\operatorname{tr}(\mathbf{S} \Phi)^{2}}\tag{10}$
在计算 $g$ 和 $h$ 之后，可以得到给定置信水平下的控制极限 $\varphi$ 。