在机器学习模式识别相关算法中,经常需要求样本的协方差矩阵C和散布矩阵S。如在PCA主成分分析中,就需要计算样本的散度矩阵,而有的教材资料是计算协方差矩阵。实质上协方差矩阵和散度矩阵的意义就是一样的,散布矩阵(散度矩阵)前乘以系数1/(n-1)就可以得到协方差矩阵了。
在模式识别的教程中,散布矩阵也称为散度矩阵,有的也称为类内离散度矩阵或者类内离差阵,用一个等式关系可表示为:
关系:散度矩阵=类内离散度矩阵=类内离差阵=协方差矩阵×(n-1)
样本的协方差矩阵乘以n-1倍即为散布矩阵,n表示样本的个数,散布矩阵的大小由特征维数d决定,是一个为d×d的半正定矩阵。
一、协方差矩阵的基础
对于二维随机变量(X,Y)之间的相互关系的数字特征,我们用协方差来描述,记为Cov(X,Y):
那么二维随机变量(X,Y)的协方差矩阵,为:
对于3维随机变量(X, Y, Z)的协方差矩阵可表示为:
现实应用中,上式n表示样本的个数,随机变量(X, Y,Z)可以看作样本的特征(属性);
需要特别说明的是:
(1)协方差矩阵是一个对称矩阵,且是半正定矩阵,主对角线是各个随机变量的方差(各个维度上的方差)。
(2)标准差和方差一般是用来描述一维数据的;对于多维情况,而协方差是用于描述任意两维数据之间的关系,一般用协方差