读Paper读的头炸(原因:太菜),坚持每天简单通俗总结一下!
故障检测是多变量过程监控的第一步。
通常,SPE(或Q-统计量)和霍特林的T2指数分别用于监测RS和PCS的正常变异性。
应注意的是,PCA或PLS建模不要求数据为高斯分布。高斯假设仅用于推导故障检测指数的适当控制限值。此外,在推导控制限值时,不需要样本的时间独立性,因为仅指定I类错误来控制假警报率。当涉及II类错误时,监测测量的时间独立性是必要的,即未检测到的故障率。
当测量值假设为高斯分布时,通常适合使用马氏距离来定义故障检测的正常区域,例如,在主分量子空间中。然而,由于过程数据通常高度相关,这使得剩余分量的方差接近于零,因此在RS中使用马氏距离将是病态的。因此,Q统计量或SPE使用欧几里德距离来定义故障检测的正常区域。由于这两个指标的互补性,还提出了用于故障检测和诊断的组合指标。
以下,我总结了这些故障检测指标。
平方预测误差(Squared prediction error,SPE)
SPE指数测量样本向量在剩余子空间上的投影,
S P E ≡ ∥ x ~ ∥ 2 = ∥ ( I − P P T ) x ∥ 2 (1) \mathrm{SPE} \equiv\|\tilde{\boldsymbol{x}}\|^{2}=\left\|\left(\mathbf{I}-\mathbf{P} \mathbf{P}^{T}\right) \boldsymbol{x}\right\|^{2}\tag{1} SPE≡∥x~∥2=∥∥(I−PPT)x∥∥2(1)
如果出现以下情况,则该过程视为正常
S P E ⩽ δ 2 (2) \mathrm{SPE} \leqslant \delta^{2}\tag{2} SPE⩽δ2(2)
其中 δ 2 \delta^{2} δ2 表示SPE的控制限值。Jackson和Mudholkar(1979)提出了控制极限 δ 2 \delta^{2} δ2 的表达式,该表达式近似于三阶矩的SPE分布。
当故障发生时,故障样本向量 x \mathbf{x} x 由与故障部分叠加的正常部分组成。故障会使SPE大于 δ 2 \delta^{2} δ2 ,从而导致检测到故障。
霍特林统计量(Hotelling’s T2)
Hotelling的 T 2 T^2 T2测量了在主分量(PCS)中的变化,
T 2 = x T P Λ − 1 P T x (3) T^{2}=\boldsymbol{x}^{T} \mathbf{P} \boldsymbol{\Lambda}^{-1} \mathbf{P}^{T} \boldsymbol{x}\tag{3} T2=xTPΛ−1PTx(3)
在正态数据服从多元正态分布的情况下, T 2 T^2 T2统计量与 F F F分布有关
N − l l ( N − 1 ) T 2 ∼ F l , N − l (4) \frac{N-l}{l(N-1)} T^{2} \sim F_{l, N-l}\tag{4} l(N−1)N−lT2∼Fl,N−l(4)
如果数据点的数目N较大,则 T 2 T^2 T2指数可以很好地近似于具有 l l l个自由度的 χ 2 \chi^2 χ2卡方分布,即,
T 2 ⩽ χ l 2 (5) T^{2} \leqslant \chi_{l}^{2}\tag{5} T2⩽χl2(5)
在正常情况下。在过程监控中,通常情况下,N非常大。因此, χ 2 \chi^2 χ2控制限值是足够的,并且经常在过程监控文献中使用。
当来自过程数据的分数不符合多元正态性假设时, T 2 T^2 T2的限值在实践中是不可靠的。相比之下,残差的表现要好得多。
综合指标(Combined Indices)
在实践中,有时最好使用一个指标而不是两个指标来监控流程。
有的论文中建议采用组合统计,但不给出控制限。
也有论文,如在Yue和Qin(1998)、Yue和Qin(2001)中,提出了一种用于故障检测的组合指标,它将SPE和 T 2 T^2 T2结合在一起,如下所示:
φ = SPE ( x ) δ 2 + T 2 ( x ) χ l 2 = x T Φ x (6) \boldsymbol{\varphi}=\frac{\operatorname{SPE}(\boldsymbol{x})}{\delta^{2}}+\frac{T^{2}(\boldsymbol{x})}{\chi_{l}^{2}}=\boldsymbol{x}^{T} \mathbf{\Phi} \boldsymbol{x}\tag{6} φ=δ2SPE(x)+χl2T2(x)=xTΦx(6)
其中,
Φ = P Λ − 1 P T χ l 2 + I − P P T δ 2 (7) \mathbf{\Phi}=\frac{\mathbf{P} \mathbf{\Lambda}^{-1} \mathbf{P}^{T}}{\chi_{l}^{2}}+\frac{\mathbf{I}-\mathbf{P} \mathbf{P}^{T}}{\delta^{2}}\tag{7} Φ=χl2PΛ−1PT+δ2I−PPT(7)
注意, Φ \mathbf{\Phi} Φ 是对称的和正定矩阵。
前辈大佬得出的控制极限,该结果提供了一个近似分布,其前两个矩与精确分布相同。作为二次指数, Φ \mathbf{\Phi} Φ 近似如下:
φ = x T Φ x ∼ g χ h 2 (8) \varphi=\boldsymbol{x}^{T} \mathbf{\Phi} \boldsymbol{x} \sim g \chi_{h}^{2}\tag{8} φ=xTΦx∼gχh2(8)
其中系数
g = tr ( S Φ ) 2 tr ( S Φ ) (9) g=\frac{\operatorname{tr}(\mathbf{S} \Phi)^{2}}{\operatorname{tr}(\mathbf{S} \Phi)}\tag{9} g=tr(SΦ)tr(SΦ)2(9)
以及
χ
2
\chi^2
χ2分布的自由度
h
=
[
tr
(
S
Φ
)
]
2
tr
(
S
Φ
)
2
(10)
h=\frac{[\operatorname{tr}(\mathbf{S} \Phi)]^{2}}{\operatorname{tr}(\mathbf{S} \Phi)^{2}}\tag{10}
h=tr(SΦ)2[tr(SΦ)]2(10)
在计算
g
g
g和
h
h
h之后,可以得到给定置信水平下的控制极限
φ
\varphi
φ 。
SPE和 T 2 T^2 T2共同定义的控制区域与组合指数的控制区域非常相似。然而,综合指标定义了一个更符合数据多正态性假设的椭圆区域。是单独使用组合指标,还是联合使用SPE和 T 2 T^2 T2,取决于应用情况。
- 具体实现代码可见 ⟶ \longrightarrow ⟶ Python代码实现-主成分分析(PCA)降维及故障诊断中的T2和SPE统计量Matplotlib出图