深度学习笔记之主成分分析

最新推荐文章于 2024-04-14 15:04:04 发布

「已注销」

最新推荐文章于 2024-04-14 15:04:04 发布

阅读量1.6k

点赞数

分类专栏：随笔

本文链接：https://blog.csdn.net/u012284960/article/details/81033845

版权

1. Definitions（定义）

主成分分析（principal components analysis, PCA）简称PCA，是一种广泛应用于数据降维（data dimensionality reduction）、有损数据压缩（lossy data compression）、特征提取（feature extraction）以及数据可视化等的一种技术，也被称为Karhunen-Lo`eve变换。

关于PCA的定义主要有两种：

PCA是一种将数据投影到低维线性空间（principal subspace，主成子空间）使得投影之后的差异最大的正交投影。
PCA是一种最小化平均投影成本（average projection cost），投影点与数据点之间的均方距离最小，即数据损失精度最小。

2. Example （例子）

我们通过一个有损压缩的例子来介绍PCA。假设我们有 $m$ 个数据点 $\left\{{\boldsymbol{x}^{(1)},\cdots,\boldsymbol{x}^{(m)}}\right\}$ ，其中数据维度为 $\boldsymbol{x}^{(1)}\in \mathbb{R}^n$ 。因此，存储这些数据，需要 $m\times n$ 个单元。为了节省存储单元，我们考虑有损压缩。有损压缩，意味着我们可以用较少的存储单元储存数据，当然，这会损失些精度。因此我们要尽量的减少精度的损失。

我们将这些数据压缩成低维数据，即每一个 $\boldsymbol{x}^{(i)}\in \mathbb{R}^n$ 都可以找到一个对应的 $\boldsymbol{c}\in \mathbb{R}^l, (n\gg l)$ 。这里，我们用映射 $f:\mathbb{R}^n\rightarrow \mathbb{R}^l$ 来表示，即 $f(\boldsymbol{x})=\boldsymbol{c}$ 。对应的解压缩，我们用函数 $\text{g}:\mathbb{R}^l\rightarrow \mathbb{R}^n$ 来表示，即 $\hat{\boldsymbol{x}}=\text{g}(f(\boldsymbol{x}))$ 。

为了解压缩尽量简单，我们限制解压缩是经过一个线性变换矩阵 $\boldsymbol{D}$ 来完成，则解压缩信号表示为 $\text{g}(c)=\boldsymbol{D}\boldsymbol{c}$ 。这里，我们限制矩阵 $\boldsymbol{D}$ 是列正交矩阵（矩阵中列两两正交）。一般来说，增大 $\boldsymbol{D}$ 的能量，需要降低 $\boldsymbol{c}$ 的能量，因此，我们对 $\boldsymbol{D}$ 进行归一化处理（归一化与未归一化大部分情况的结果是相等的，但也存在一些情况下归一化的情况更好，因此通常我们会对 $\boldsymbol{D}$ 进行归一化处理）。

我们从矩阵乘法的角度来理解 $\boldsymbol{x}=\boldsymbol{Dc}$ 。通常，我们理解矩阵乘法从图的左图出发，但一般不会考虑右图的理解方式。这里，我们从右图的理解方式出发。由于 $\boldsymbol{D}$ 是列正交的，因此 $\left\{{\boldsymbol{d}_i}\right\}_{i\in [l]}$ 张成了一个 $l$ 空间，而 ${d_{i}}_{i \in [l]}$

最低0.47元/天解锁文章

「已注销」

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
深度学习笔记之主成分分析

我们通过一个有损压缩的例子来介绍主成分分析（Principal components analysis, PCA）。 Example 假设我们有mmm个数据点{x(1),⋯,x(m)}{x(1),⋯,x(m)}\left\{{\boldsymbol{x}^{(1)},\cdots,\boldsymbol{x}^{(m)}}\right\}，其中数据维度为x(1)∈Rnx(1)∈Rn\bolds...
复制链接

扫一扫