【sklearn第二十二讲】协方差估计

本文介绍了Python sklearn库中用于协方差估计的各种方法,包括经验协方差、缩水协方差、稀疏的可逆协方差、健壮的协方差估计以及Minimum Covariance Determinant。这些估计方法在处理数据时各有优势,例如应对小样本、数值问题、异常点等。文章详细阐述了每种方法的原理和应用场景,并提到了如何在scikit-learn中实现这些估计。
摘要由CSDN通过智能技术生成

机器学习训练营——机器学习爱好者的自由交流空间(入群联系qq:2279055353)

很多统计问题要求总体协方差阵的点估计,大多数情况下,估计是由样本得到的,而样本的属性(大小、结构、同质性)对估计质量有很大的影响。sklearn.covariance包旨在提供不同情况下协方差阵的准确估计。估计前,我们假设样本是独立同分布的。

经验协方差

一个数据集的协方差阵的经典的估计来自最大似然估计量,或称经验协方差。使用包的empirical_covariance函数计算最大似然估计,具体是用EmpiricalCovariance.fit方法在数据样本上拟合EmpiricalCovariance对象。数据集是否中心化,结果将不同。你可以设置中心化参数assume_centered.

缩水协方差

有时由于数值的原因,经验协方差并不是可逆的。为了避免不可逆的问题,提出了经验协方差的转换:shrinkage.

在scikit-learn里,通过shrunk_covariance方法,转换可以直接应用到计算的协方差上。而且,用ShrunkCovariance对象的ShrunkCovariance.fit方法,一个协方差阵的缩水估计量能够拟合到数据上。结果也会因为数据集是否中心化而不同,使用参数assume_centered设置。

数学上,缩水是由减小经验协方差阵的最大特征值和最小特征值的比率组成。
Σ s h r u n k = ( 1 − α ) Σ ^ + α

  • 0
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值