异常检测算法(三):稳健协方差(Robust Covariance)【基于协方差的稳健估计,假设数据是高斯分布的,那么在这样的案例中执行效果将优于One-Class SVM】

本文介绍了异常检测中的稳健协方差方法,特别是最小协方差确定(MCD),它在高斯分布的数据中表现优秀。经验协方差和收缩协方差被讨论,用于处理样本数据的不确定性。当样本数量充足时,最大似然估计可作为协方差矩阵的近似。收缩协方差则用于解决经验协方差矩阵可能无法求逆的问题。参考了scikit-learn和pyod等资源。
摘要由CSDN通过智能技术生成

Robust Covariance (Minimum Covariance Determinant) 是 sklearn 提供的求离群点数据的例子中出现过。

目的是在于通过 EllipticEnvelope(contamination=0.25) 求给定数据集的协方差矩阵。

经验协方差

有时候由于种种原因,并不使用全部的样本数据计算协方差矩阵,而是利用部分样本数据计算,这时候就要考虑利用部分样本计算得到的协方差矩阵是否和真实的协方差矩阵相同或者近似。

当提供的样本数目相对于特征数足够多时,利用最大似然估计(或者称为经验协方差)计算的结果,可以认为是协方差矩阵的几个近似结果。这种情况下,会假设数据的分布符合一个多元正太分布,数据的概率密度函数中是包含协方差矩阵的,利用最大似然函数,对其进行估计。

收缩协方差

在矩阵的求逆过程中, 最大似然估计不是协方差矩阵的特征值的一个很好的估计, 所以从反演得到的精度矩阵是不准确的。 有时,甚至出现因矩阵元素地特性,经验协方差矩阵不能求逆。 为了避免这样的反演问题,引入了经验协方差矩阵的一种变换方式,收缩协方差。




参考资料:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值