协方差矩阵相关概念、性质、应用意义及矩阵特征向量的用处

最新推荐文章于 2025-03-07 19:22:32 发布

置顶小勺挖泰山

最新推荐文章于 2025-03-07 19:22:32 发布

阅读量4.1w

点赞数 62

分类专栏：矩阵特征向量的应用文章标签：协方差矩阵相关概念性质应用意义及矩阵特征向量的用处统计学

本文链接：https://blog.csdn.net/baidu_32134295/article/details/52492806

版权

矩阵特征向量的应用专栏收录该内容

3 篇文章

订阅专栏

1.协方差矩阵的概念：

这里在讲述协方差矩阵的性质之前先讲解一下协方差、方差以及两者之间的关系【统计学中的样本方差、样本均值看我的另外一篇文章{ 浅谈均值、方差、标准差、协方差的概念及意义 }】

一：方差：描述的是样本集合的各个样本点到均值的距离之平均，一般是用来描述一维数据的。

方差是用来衡量单个变量“自身变异”大小的总体参数，方差越大表明该变量的变异越大。

二：协方差是用来衡量两个变量之间“协同变异大小的总体参数，即二个变量相互影响的大小的参数，协方差的绝对值越大，则两个变量相互影响越大。”

协方差的性质：①. 是一种用来衡量两个随机变量关系的统计量。②. 只能处理二维问题。③. 计算协方差需要计算均值。

如下式：定义量E｛[X-E(X)] [Y-E(Y)]｝称为随机变量X和Y的协方差。记为Cov(X，Y),即

Cov(X，Y)=E｛[X-E(X)] [Y-E(Y)]｝而称为随机变量X和Y的相关系数。

当上式结果为正时表示随机变量X和Y正相关，为负值是表示随机变量X和Y为负相关，结果为0表示两者相互独立，无关。

三：方差与协方差的关系

Cov(X，Y)=Cov(Y，X)；Cov(X，X)=D(X).

对任意两个随机变量X和Y，下列等式成立：D(X+Y)=D(X)+D(Y)+2Cov(X，Y)。

将Cov(X，Y)的定义式展开，易得Cov(X，Y)=E(XY)-E(X)E(Y)

2.协方差矩阵的性质：

①. 协方差矩阵能处理多维问题；

②. 协方差矩阵是一个对称的矩阵，而且对角线是各个维度上的方差；

③. 协方差矩阵计算的是不同维度之间的协方差，而不是不同样本之间的；

④. 样本矩阵中若每行是一个样本，则每列为一个维度，所以计算协方差时要按照列计算均值。

如果数据是3维的，那么协方差矩阵是：

由性质④可知：

详细实例请看连接文章：http://blog.csdn.net/ybdesire/article/details/6270328/

协方差(i，j)=(第 i 列所有元素中每个元素都 - 第 i 列均值)*(第 j 列所有元素 - 第 j 列均值)

协方差的matlab计算公式则为：协方差(i，j)=(第 i 列所有元素中每个元素都 - 第 i 列均值)*(第 j 列所有元素 - 第 j 列均值)/(样本数-1)

3.矩阵特征值、特征向量以及局部坐标系之间的关系

关于特征值及特征向量的相关概念参考线性代数有关知识点：这里先来了解两个定理：

定理1：设r1、r2、...rm是方阵A的m个特征值，p1、p2、...pm依次是与之对应的特征向量，如果r1、r2、...rm各不相等，则p1、p2、...pm线性无关。

定理2：设r1、r2是对称矩阵A的两个特征值，p1、p2是对应的特征向量，若r1与r2不想等，则p1和p2正交。

线性变化：

线性变换(线性映射)是在作用于两个向量空间之间的函数，它保持向量加法和标量乘法的运算，从一个向量空间变化到另一个向量空间。实际上线性变换表现出来的就是一个矩阵。

特征值和特征向量是一体的概念：

对于一个给定的线性变换（矩阵A），它的特征向量经过这个线性变换之后，得到的新向量仍然与原来的保持在同一條直線上，但其长度也许會改变。一个特征向量的长度在该线性变换下缩放的比例(λ)称为其特征值（本征值）。

数学描述：Aξ=λξ

在线性变换的作用下，向量仅仅在尺度上变为原来的倍。称是线性变换的一个特征向量，是对应的特征值。

矩阵是一个表示二维空间的数组，矩阵可以看做是一个变换。在线性代数中，矩阵可以把一个向量变换到另一个位置，或者说从一个坐标系变换到另一个坐标系。矩阵的“基”，实际就是变换时所用的坐标系。
矩阵乘法对应了一个变换，是把任意一个向量变成另一个方向或长度都大多不同的新向量。在这个变换的过程中，原向量主要发生旋转、伸缩的变化。如果矩阵对某一个向量或某些向量只发生伸缩变换，不对这些向量产生旋转的效果，那么这些向量就称为这个矩阵的特征向量，伸缩的比例就是特征值。
任意给定一个矩阵A，并不是对所有的向量x它都能拉长（缩短）。凡是能被矩阵A拉长（缩短）的向量就称为矩阵A的特征向量（Eigenvector）；拉长（缩短）的量就是这个特征向量对应的特征值（Eigenvalue）。
一个矩阵可能可以拉长（缩短）多个向量，因此它就可能有多个特征值。
对于实对称矩阵来说，不同特征值对应的特征向量必定正交。
一个变换矩阵的所有特征向量组成了这个变换矩阵的一组基。所谓基，可以理解为坐标系的轴。我们平常用到的大多是直角坐标系，在线性代数中可以把这个坐标系扭曲、拉伸、旋转，称为基变换。我们可以按需求去设定基，但是基的轴之间必须是线性无关的，也就是保证坐标系的不同轴不要指向同一个方向或可以被别的轴组合而成，否则的话原来的空间就“撑”不起来了。在主成分分析（PCA）中，我们通过在拉伸最大的方向设置基，忽略一些小的量，可以极大的压缩数据而减小失真。
变换矩阵的所有特征向量作为空间的基之所以重要，是因为在这些方向上变换矩阵可以拉伸向量而不必扭曲它，使得计算大为简单。因此特征值固然重要，但我们的终极目标却是特征向量。
同一特征值的任意多个特征向量的线性组合仍然是A属于同一特征值的特征向量。

　　顾名思义，特征值和特征向量表达了一个线性变换的特征。在物理意义上，一个高维空间的线性变换可以想象是在对一个向量在各个方向上进行了不同程度的变换，而特征向量之间是线性无关的，它们对应了最主要的变换方向，同时特征值表达了相应的变换程度。

　　具体的说，求特征向量，就是把矩阵A所代表的空间进行正交分解，使得A的向量集合可以表示为每个向量a在各个特征向量上的投影长度。我们通常求特征值和特征向量即为求出这个矩阵能使哪些向量只发生拉伸，而方向不发生变化，观察其发生拉伸的程度。这样做的意义在于，看清一个矩阵在哪些方面能产生最大的分散度（scatter），减少重叠，意味着更多的信息被保留下来。