数学基础（三）PCA原理与推导

Billie使劲学

已于 2022-08-25 16:03:50 修改

阅读量1.2k

点赞数

分类专栏：机器学习文章标签：算法线性代数人工智能机器学习神经网络

于 2022-08-08 19:00:09 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_45447650/article/details/126214148

版权

机器学习专栏收录该内容

15 篇文章 8 订阅

订阅专栏

目录

一、PCA数据压缩原理

二、样本点中心化

三、计算误差

一、PCA数据压缩原理

二、样本点中心化

u向量的方向已经确定，我们将样本点映射到u向量上，显然右图的误差要比左图大许多，因此我们就需要先对样本进行中心化，使之分布于原点O附近。即计算所有样本点的均值（x的均值，y的均值），然后将每个样本点减去这个均值，就得到了中心化之后的样本。

三、计算误差

（注意：以下字母加粗表示向量）如下图所示，u为单位向量，表示映射的主方向，x为样本，pijx为x在u上的投影，我们要计算x投影在u上产生的误差e。

样本x映射到u上产生的误差e为：

这个式子可以从向量角度理解：我们要计算e，根据向量的加法原则（首尾相连），pijx+e=x。

则得到 e=x-pijx。

pijx即为x在u上的映射，我们表示为： $\left \langle \vec{x},\vec{u} \right \rangle\vec{u}$

该公式转化成矩阵的形式如下图所示：

e的模长即为损失的大小：

下面的公式推导不难理解

其中x，u为列向量，故 $x^Tu$ 为一个实数，且 $x^Tu=u^Tx$ ，不需要进行转置，且可以交换。

得到损失为：

$\begin{Vmatrix} x \end{Vmatrix}^2$ 是固定的，故想要损失降到最低，则需要使 $(x^Tu)^2$ 最大。

则如下图所示，其中 $x^Tu=u^Tx$

如果只有一个样本，则，直接求最大值。

但此时有N个样本，那要怎么求最大值呢？

将这N样本进行求和：

我们令为X。

这样我们的最大化目标就变为：

我们使用拉格朗日条件极值计算最大值（条件为 $u^Tu=1$ ）：

对u求导等于0得到：

对λ求导等于0得到：

满足这两个条件，即可求得最大值，求解n个 λ 和n个u的值，其中λ最大的那个值对应的方向就是最主要的方向，n维降到k维，保留几维就保留几个λ，即λ的个数等于k。

注意：矩阵求偏导相关知识请见：

矩阵求导、几种重要的矩阵及常用的矩阵求导公式_~青萍之末~的博客-CSDN博客_矩阵求导公式大全

Billie使劲学

关注

0
点赞
踩
7

收藏

觉得还不错? 一键收藏
打赏
0
评论
数学基础（三）PCA原理与推导

u向量的方向已经确定，我们将样本点映射到u向量上，显然右图的误差要比左图大许多，因此我们就需要先对样本进行中心化，使之分布于原点O附近。即计算所有样本点的均值（x的均值，y的均值），然后将每个样本点减去这个均值，就得到了中心化之后的样本。......
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

Billie使劲学 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。