1、相关概念:
1)均值
X¯=∑ni=1Xi(n−1)
2)标准差
S=∑ni=1(Xi−X¯)2(n−1)−−−−−−−−−−√
3)方差
S2=∑ni=1(Xi−X¯)2(n−1)
2、协方差
上述一般是用来描述一维数据的,对于多维数据集,量度两个随机变量的关系可使用协方差,定义如下:
cov(X,Y)=∑ni=1(Xi−X¯)(Yi−Y¯)(n−1)
3、相关性质
容易得知:
1、
cov(X,X)=var(X)
2、
cov(X,Y)=cov(Y,X)
3、
cov(aX,bY)=abcov(X,Y)
4、
cov(X1+X2,Y)=cov(X1,Y)+cov(X2,Y)
当维数变得更多时,就生成了协方差矩阵,例如对于三维数据集{x,y,z},则协方差矩阵为
C=⎛⎝⎜cov(x,x)cov(y,x)cov(z,x)cov(x,y)cov(y,y)cov(z,y)cov(x,z)cov(y,z)cov(z,z)⎞⎠⎟