7.2 PCA-机器学习笔记-斯坦福吴恩达教授

最新推荐文章于 2024-08-03 19:12:05 发布

Zhao-Jichao

最新推荐文章于 2024-08-03 19:12:05 发布

阅读量494

点赞数

分类专栏：机器学习ML 文章标签：机器学习深度学习人工智能计算机视觉算法

本文链接：https://blog.csdn.net/weixin_36815313/article/details/105151075

版权

机器学习ML 专栏收录该内容

98 篇文章 65 订阅

订阅专栏

PCA（主成分分析）

PCA，Principle Component Analysis，即主成分分析法，是特征降维的最常用手段。顾名思义，PCA 能从冗余特征中提取主要成分，在不太损失模型质量的情况下，提升了模型训练速度。
在这里插入图片描述
如上图所示，我们将样本到红色向量的距离称作是投影误差（Projection Error）。以二维投影到一维为例，PCA 就是要找寻一条直线，使得各个特征的投影误差足够小，这样才能尽可能的保留原特征具有的信息。

假设我们要将特征从 $n$ 维度降到 $k$ 维：PCA 首先找寻 $k$ 个 $n$ 维向量，然后将特征投影到这些向量构成的 $k$ 维空间，并保证投影误差足够小。下图中中，为了将特征维度从三维降低到二位，PCA 就会先找寻两个三维向量 $u^{(1)}$ , $u^{(2)}$ ，二者构成了一个二维平面，然后将原来的三维特征投影到该二维平面上：
在这里插入图片描述

算法流程

假定我们需要将特征维度从 $n$ 维降到 $k$ 维。则 PCA 的执行流程如下：

特征标准化，平衡各个特征尺度：
$x^{(i)}_j=\frac{x^{(i)}_j−μ_j}{sj},\ μ_j 为特征\ j\ 的均值，s_j\ 为特征\ j\ 的标准差。$
计算协方差矩阵 $Σ$ ：
$\Sigma = \frac 1m \sum_{i=1}^m(x^{(i)})(x^{(i)})^T =\frac1m\cdot X^TX$
通过奇异值分解（SVD），求取 $Σ$ 的特征向量（eigenvectors）：
$(U,S,V^T)=SVD(\Sigma)$
从 $U$ 中取出前 $k$ 个左奇异向量，构成一个约减矩阵 $U r e d u c e$ :
$U_{reduce}=(u^{(1)},u^{(2)},⋯,u^{(k)})$
计算新的特征向量： $z^{(i)}$
$z^{(i)}=U^T_{reduce}⋅x^{(i)}$

特征还原

因为PCA仅保留了特征的主成分，所以PCA是一种有损的压缩方式，假定我们获得新特征向量为：
$z=U^T_{reduce}x$

那么，还原后的特征 $x_{approx}$ 为：
$x_{approx}=U_{reduce}z$

在这里插入图片描述

降到多少维才合适？

从 PCA 的执行流程中，我们知道，需要为 PCA 指定目的维度 $k$ 。如果降维不多，则性能提升不大；如果目标维度太小，则又丢失了许多信息。通常，使用如下的流程的来评估 $k$ 值选取优异：

求各样本的投影均方误差:
$\min \frac 1m \sum_{j=1}^m||x^{(i)}-x^{(i)}_{approx}||^2$
求数据的总变差：
$\frac 1m \sum_{j=1}^m||x^{(i)}||^2$
评估下式是否成立:
$\frac {\min \frac 1m \sum_{j=1}^m||x^{(i)}-x^{(i)}_{approx}||^2} {\frac 1m \sum_{j=1}^m||x^{(i)}||^2} ≤ϵ$