本文是对1.3中自相关和自协方差矩阵的补充。
是一个m维随机向量,其中每一个分量都是一个随机变量。由1.3中自相关矩阵的定义,有:,。以三维的详细来看:
,,,构造了6个随机变量。最后再取这六个随机变量的均值,就得到了自相关矩阵。如果随机变量已经归一化处理后后,那么自相关就变成了协方差。自相关矩阵和协方差矩阵有两种方式计算:
(1)当给出的是每一个随机变量的分布律时,比如x1的取值有两种(0和1),对应的概率分别是1/3,2/3,即:,
x2,x3的分布律如下:,,此时求那六个随机变量之间的自相关,利用:可求出来每两个随机变量的自相关。每一个自相关求出来以后,再放到对应的位置上即可。
可求出来每两个随机变量的协方差,每一个协方差求出来以后,再放到对应的位置上即可。
(2)另外一种方法求协方差矩阵就是给定了样本的数据矩阵(注意到角标在上边,代表每一个样本),在这个矩阵中,每一个列向量对应的是每一个样本在m个特征上的取值,一共有n个样本。
举例来看:样本的数据矩阵是,表示观测到2个样本,
利用矩阵乘法的性质,写成向量外积后的矩阵再相加,有:
,到这里观察,乘积后取平均的矩阵第一行第一列的元素
:刚好就是在第一特征上,每一个样本的平方和再相加,即:,就是第一个特征再所有观测样本上的均值。同理有:,右上角代表的是第几个样本,右下角代表的是第几个特征,其余同理。所以最后我们知道就是样本的自相关矩阵。同理,当数据本身进行了归一化后,就是协方差矩阵。