使用协方差估计时,通常的方法是使用最大似然估计器,例如sklearn.covariance.EmpiricalCovariance
,它是无偏的,即当给定许多观测值时,它会收敛到真实(总体)协方差,但是对它进行正则化以减少其方差也是有益的,反过来则会带来一些偏差。本示例说明了在Shrunk Covariance估计器中使用简单正则化的效果,特别地,它着重于如何设置正则化的量,即如何选择偏差方差折衷。
- 根据潜在收缩参数网格,通过交叉验证three folds likelihood来设置参数。
- Ledoit和Wolf提出的一个近似公式(close formula),用于计算渐近最优正则化参数(最小化MSE准则),从而得出
sklearn.covariance.LedoitWolf
协方差估计。 - Chen等人提出了Ledoit-Wolf收缩率的改进方法`sklearn.covariance.OAS`。在数据呈高斯分布的假设下,它的收敛性明显更好,特别是对于小样本来说。