主成分分析与隐变量模型解析-CSDN博客

本文链接：https://blog.csdn.net/qq_20602929/article/details/51061909

本文介绍了主成分分析（PCA）作为一种无监督方法，用于高维数据的降维和可视化，强调了PCA在保留数据结构特征方面的优势。同时，文章探讨了隐变量模型，包括隐变量分类和变分贝叶斯方法，解释了如何在数据中引入隐变量以进行近似推理。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

$\,\,\,\,\,\,\,\,$ 用于聚类的无监督方法——将数据对象分割成有限数目的不相关组，使得同组中的数据对象具有某些相似性。现在引入第二类无监督方法，这种方法通常被归类于投影技术
$\,\,\,\,\,\,\,\,$ 用于处理高维的数据集，以及如何通过将数据集投影到低维空间对数据进行可视化或者特征选择。这些技术用于处理更大规模的隐变量模型

参数的数量随着维度M的增加而增加，我们将M维数据投影到D维的同时，希望在某种程度上保留感兴趣的属性

方差——感兴结构的代表
对数据进行投影操作时，我们希望尽可能保留数据中感兴趣的结构
数据在每个一维空间的方差可以通过下式计算：
$\sigma^2=\frac{1}{N}\sum_{n=1}^N (x_{n}-\mu_{x})^2$
如果想要表达数据的聚类结构，在使方差最大的方向上对数据进行投影更能保留这一结构特征
基于这个原因，当考虑投影方向时，方差是一个很好的最大化度量标准。因此在大多流行的投影技术中，如主成分分析，使用方差作为最大化度量的标准。