平方预测误差(Squared prediction error,SPE)和霍特林统计量(Hotelling’s T2)原理

读Paper读的头炸(原因:太菜),坚持每天简单通俗总结一下!


故障检测是多变量过程监控的第一步。

通常,SPE(或Q-统计量)和霍特林的T2指数分别用于监测RS和PCS的正常变异性。

应注意的是,PCA或PLS建模不要求数据为高斯分布。高斯假设仅用于推导故障检测指数的适当控制限值。此外,在推导控制限值时,不需要样本的时间独立性,因为仅指定I类错误来控制假警报率。当涉及II类错误时,监测测量的时间独立性是必要的,即未检测到的故障率。

当测量值假设为高斯分布时,通常适合使用马氏距离来定义故障检测的正常区域,例如,在主分量子空间中。然而,由于过程数据通常高度相关,这使得剩余分量的方差接近于零,因此在RS中使用马氏距离将是病态的。因此,Q统计量或SPE使用欧几里德距离来定义故障检测的正常区域。由于这两个指标的互补性,还提出了用于故障检测和诊断的组合指标。

以下,我总结了这些故障检测指标。

平方预测误差(Squared prediction error,SPE)

SPE指数测量样本向量在剩余子空间上的投影,

S P E ≡ ∥ x ~ ∥ 2 = ∥ ( I − P P T ) x ∥ 2 (1) \mathrm{SPE} \equiv\|\tilde{\boldsymbol{x}}\|^{2}=\left\|\left(\mathbf{I}-\mathbf{P} \mathbf{P}^{T}\right) \boldsymbol{x}\right\|^{2}\tag{1} SPEx~2=(IPPT)x2(1)

如果出现以下情况,则该过程视为正常

S P E ⩽ δ 2 (2) \mathrm{SPE} \leqslant \delta^{2}\tag{2} SPEδ2(2)

其中 δ 2 \delta^{2} δ2 表示SPE的控制限值。Jackson和Mudholkar(1979)提出了控制极限 δ 2 \delta^{2} δ2 的表达式,该表达式近似于三阶矩的SPE分布。

当故障发生时,故障样本向量 x \mathbf{x} x 由与故障部分叠加的正常部分组成。故障会使SPE大于 δ 2 \delta^{2} δ2 ,从而导致检测到故障。

霍特林统计量(Hotelling’s T2)

Hotelling的 T 2 T^2 T2测量了在主分量(PCS)中的变化,

T 2 = x T P Λ − 1 P T x (3) T^{2}=\boldsymbol{x}^{T} \mathbf{P} \boldsymbol{\Lambda}^{-1} \mathbf{P}^{T} \boldsymbol{x}\tag{3} T2=xTPΛ1PTx(3)

在正态数据服从多元正态分布的情况下, T 2 T^2 T2统计量与 F F F分布有关

N − l l ( N − 1 ) T 2 ∼ F l , N − l (4) \frac{N-l}{l(N-1)} T^{2} \sim F_{l, N-l}\tag{4} l(N1)NlT2Fl,Nl(4)

如果数据点的数目N较大,则 T 2 T^2 T2指数可以很好地近似于具有 l l l个自由度的 χ 2 \chi^2 χ2卡方分布,即,

T 2 ⩽ χ l 2 (5) T^{2} \leqslant \chi_{l}^{2}\tag{5} T2χl2(5)

在正常情况下。在过程监控中,通常情况下,N非常大。因此, χ 2 \chi^2 χ2控制限值是足够的,并且经常在过程监控文献中使用。

当来自过程数据的分数不符合多元正态性假设时, T 2 T^2 T2的限值在实践中是不可靠的。相比之下,残差的表现要好得多。

综合指标(Combined Indices)

在实践中,有时最好使用一个指标而不是两个指标来监控流程。

有的论文中建议采用组合统计,但不给出控制限。

也有论文,如在Yue和Qin(1998)、Yue和Qin(2001)中,提出了一种用于故障检测的组合指标,它将SPE T 2 T^2 T2结合在一起,如下所示:

φ = SPE ⁡ ( x ) δ 2 + T 2 ( x ) χ l 2 = x T Φ x (6) \boldsymbol{\varphi}=\frac{\operatorname{SPE}(\boldsymbol{x})}{\delta^{2}}+\frac{T^{2}(\boldsymbol{x})}{\chi_{l}^{2}}=\boldsymbol{x}^{T} \mathbf{\Phi} \boldsymbol{x}\tag{6} φ=δ2SPE(x)+χl2T2(x)=xTΦx(6)

其中,

Φ = P Λ − 1 P T χ l 2 + I − P P T δ 2 (7) \mathbf{\Phi}=\frac{\mathbf{P} \mathbf{\Lambda}^{-1} \mathbf{P}^{T}}{\chi_{l}^{2}}+\frac{\mathbf{I}-\mathbf{P} \mathbf{P}^{T}}{\delta^{2}}\tag{7} Φ=χl2PΛ1PT+δ2IPPT(7)

注意, Φ \mathbf{\Phi} Φ 是对称的和正定矩阵。

前辈大佬得出的控制极限,该结果提供了一个近似分布,其前两个矩与精确分布相同。作为二次指数, Φ \mathbf{\Phi} Φ 近似如下:

φ = x T Φ x ∼ g χ h 2 (8) \varphi=\boldsymbol{x}^{T} \mathbf{\Phi} \boldsymbol{x} \sim g \chi_{h}^{2}\tag{8} φ=xTΦxgχh2(8)

其中系数

g = tr ⁡ ( S Φ ) 2 tr ⁡ ( S Φ ) (9) g=\frac{\operatorname{tr}(\mathbf{S} \Phi)^{2}}{\operatorname{tr}(\mathbf{S} \Phi)}\tag{9} g=tr(SΦ)tr(SΦ)2(9)

以及 χ 2 \chi^2 χ2分布的自由度
h = [ tr ⁡ ( S Φ ) ] 2 tr ⁡ ( S Φ ) 2 (10) h=\frac{[\operatorname{tr}(\mathbf{S} \Phi)]^{2}}{\operatorname{tr}(\mathbf{S} \Phi)^{2}}\tag{10} h=tr(SΦ)2[tr(SΦ)]2(10)
在计算 g g g h h h之后,可以得到给定置信水平下的控制极限 φ \varphi φ

SPE T 2 T^2 T2共同定义的控制区域与组合指数的控制区域非常相似。然而,综合指标定义了一个更符合数据多正态性假设的椭圆区域。是单独使用组合指标,还是联合使用SPE T 2 T^2 T2,取决于应用情况。

评论 11
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

府学路18号车神

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值