PRML读书笔记——连续潜在变量

最新推荐文章于 2024-10-26 16:31:01 发布

GZGlenn

最新推荐文章于 2024-10-26 16:31:01 发布

阅读量2.4k

点赞数 2

分类专栏：机器学习文章标签：读书笔记 PRML 机器学习 PCA 主成分分析

本文链接：https://blog.csdn.net/hubin232/article/details/70196221

版权

本文详细介绍了主成分分析（PCA）的两种形式：最大方差形式和最小误差形式，并通过最大似然求解探讨了概率PCA。此外，还讨论了核PCA以及非线性隐含变量模型，如独立成分分析和自关联网络，为非线性数据建模提供了思路。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

这一章主要讲解PCA相关的技术

主成分分析

PCA可以被定义为数据在低维线性空间上的正交投影，这个线性空间被称为主⼦空间，使得投影数据的⽅差被最⼤化。下面从两个角度给出定义

最大方差形式

考虑⼀组观测数据集 $\left \{ x_{n} \right \}$ ，其中 $n= 1,...,N$ ，因此 $x_{n}$ 是⼀个D维欧⼏⾥得空间中的变量。我们的⽬标是将数据投影到维度 $M<D$ 的空间中，同时最⼤化投影数据的⽅差。

这里考虑 $M=1$ 的情况，使用D维向量 $u_{1}$ 定义这个空间的⽅向。不失一般性，把 $u_{1}$ 当做单位向量，假定 $u_{1}^{T}u_{1}=1$ 。这样，每个数据点 $x_{n}$ 被投影到⼀个标量值 $u^{T}_{1}x_{n}$ 上。投影数据的均值是 $u^{T}_{1}\overline{x}$ ，其中， $\overline{x}$ 是样本集合的均值。那么，投影数据的方差为：