机器学习训练营——机器学习爱好者的自由交流空间(入群联系qq:2279055353)
通常的协方差最大似然估计对数据集里的异常点(outliers
)是非常敏感的。在这样的情况下,使用稳健的协方差估计,保证对即使数据集存在错误的观测,估计量也是一致的。
极小极大协方差行列式估计
极小极大协方差行列式估计量(Minimum Covariance Determinant Estimator, MCDE
), 通常被用来估计高度污染(contaminated
)的数据集的协方差。数据集的受污染程度,可以达到
n s a m p l e s − n f e a t u r e s − 1 2 \dfrac{n_{samples}-n_{features}-1}{2} 2nsamp