PCA与SVD

最新推荐文章于 2024-09-06 21:50:51 发布

ReLuJie

最新推荐文章于 2024-09-06 21:50:51 发布

阅读量260

点赞数 1

分类专栏：机器学习 # 降维去噪文章标签： PCA

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/On_theway10/article/details/100171583

版权

机器学习同时被 2 个专栏收录

16 篇文章 1 订阅

订阅专栏

2 篇文章 0 订阅

订阅专栏

Outline

预备知识

样本实例 ： $x_{i}\in R^{D}$ 表示第i个样本，它的特征维度为D；
样本矩阵： $X\in R^{N\times D}$ , 其中N表示样本个数，D表示样本维数；
內积矩阵： $K\in R^{N\times N}$ , 元素 $K_{ij}$ 表示样本 $x_{i}$ 与样本 $x_{j}$ 的相似度；
协方差矩阵: $S \in R^{D\times D}$ ，元素 $S _{ij}$ 表示维度 i 与维度 j 的协方差；
正交矩阵： $U\in R^{m\times m}$ , 满足： $UU^{T}=U^{T}U=I_{n}$ ；
酉矩阵： $U\in C^{m\times m}$ , 满足： $UU^{+}=U^{+}U=I_{n}$ ， $U^{+}$ 表示的共轭转置；
Hermite矩阵： $X\in R^{N\times N}$ , 若 $X = X^{+}$ ，其中 $\overline{A}$ 表示共轭矩阵；

SVD

设A是一个阶矩阵，其中元素均属于数域K（即实数域或者复数域），则存在一个分解使得：

$A = U \Sigma V^{T}$

其中，其中U是m×m阶酉矩阵；Σ是半正定m×n阶对角矩阵；而V*，即V的共轭转置，是n×n阶酉矩阵。这样的分解就称作M的奇异值分解。Σ对角线上的元素Σi，其中Σi即为M的奇异值。

PCA

View-1:最大化投影方差

假定对于数据集 $X\in R^{N\times D}$ ， 我们打算把数据投影到一个一维空间（维度降为1维），因此需要寻找一个投影向量 $u\in R^{ D}$ 。为了唯一确定该投影向量，我们对其加以限制： $u^{ T}u=1$ .首先，计算样本均值：

然后，计算投影后样本的方差：

其中，S表示样本协方差矩阵，定义如下：

考虑到投影向量u1的约束条件，我们可通过引入拉格朗日乘子，将带约束的优化问题转为无约束的优化问题：

上述优化目标关于u1求导置零，得到：

, 即

从而，所求投影向量即为样本协方差矩阵最大的特征值对应的特征向量！一般地，假设我们想要把数据投影到一个M+1维子空间，而我们已经得到了M个投影向量，则第M+1个投影向量必须与已有的M个向量线性无关，为了保证这一点，我们可以让 $u_{M+1}$ 与u1, ... ,uM正交【为什么？如果不正交呢？】。类似地，我们可以得到如下的目标函数：

上述优化目标关于 $u_{M+1}$ 求导置零，得到：

上式依次乘以 $u_{j}^{T} (j=1,2, ..., M)$ ,可得 $\eta_{j} = 0 , (j=1,2, ..., M)$ .因此，有：

即，所求的第M+1个投影向量为样本协方差矩阵的第M+1个特征值对应的特征向量。

View-2:最小化投影误差

对于数据集 $X\in R^{N\times D}$ ，我们引入一组完备的正交基 $u_{i} (i=1,2, ..., D)$ , 对于样本 $x_{n}$ 而言，它在原来的坐标系（基向量）下的的坐标为{ $x_{n1}, ..., x_{nD}$ },则它在新的坐标系下可被表示为：

由 $u_{i} (i=1,2, ..., d)$ 相互正交的特性可知：.于是有：

我们打算：用 $x_{n}$ 在M<D维子空间的投影点来尽可能地逼近它在D维空间中的位置。不失一般性，假设M维子空间由正交基的前M个基构成，于是得到如下的近似点：

注意，这里需要说明的一点是，近似点 $\widetilde{x}_{n}$ 的M+1至D的分量由剩余的正交基的线性组合来产生，这里bi对所有近似样本都取一样的值。至此，我们可以得到数据集的重构误差：

最小化上述重构误差，得到：，j = 1,2, ..., M; , j = M+1, ..., D. 于是得到：

进一步，重构误差可以化简为：

类似地，考虑基的正交性和单位模的约束，不难得到：

因此，为了使得重构误差最小化，应该选择最大的M的特征值对应的特征向量作为投影向量！

实验结果

Mnist

Nature image

gray_img 1st_pc 5 pcs 25-pc

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

ReLuJie 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。