从PCA到AutoEncoder

本文介绍了PCA的基本原理,包括最大方差与最小重构误差视角,以及PCA的计算复杂度问题。接着,讨论了PPCA的概率模型优势,并引入Kernel PCA以处理非线性特征。此外,文章还探讨了ICA对于非高斯分布数据的独立成分分析。随后,重点转向AutoEncoder,解释了Undercomplete AutoEncoder、Sparse AutoEncoder和Stacked AutoEncoder的特性,以及它们如何用于数据降维和特征学习。特别地,文中提到了Denoising AutoEncoder和Contrastive AutoEncoder,增强了模型的泛化能力。最后,介绍了VAE和AAE,它们通过对编码的约束来促进更有效的表示学习。
摘要由CSDN通过智能技术生成

PCA

理论简单,计算只涉及到线性代数的计算,特征保持正交性,如果原始特征不具有正交性,只有独立性,这个时候可以使用ICA。
有两种可产生相同算法的等价视角:最大方差和最小重构误差。两种视角都希望找到一组正交投影,把原数据投影到低维的线性子空间上。但最大方差视角是说,我们希望数据投影之后在投影方向上有最大方差;而最小重构误差视角是说,我们希望投影后的数据和原数据之间的均方差最小。
计算过程:

  1. 定义样本均值和样本协方差
  2. 可以得到某个投影方向u_1上的方差
  3. 方差最大作为目标函数,把这个问题看作有约束最优化问题,因此可用拉格朗日乘子法求解,令导数为0,线性代数中的特征值分解问题,求得特征值和特征向量。
    在余下的方向中依次选择最大方差方向,就是S由大到小给出的各个特征值以及对应的特征向量,由于S是实对称矩阵,得到的特征向量之间是正交,线性无关,可以互不影响,依次求解。
    最小重构误差视角和最大方差视角一样,也是特征值问题。只不过这里是去掉较小特征值对应的方向,因为那些方向对应着较小的重构误差,而先前是保留较大特征值对应的方向。但得到的结果是完全一样的。


PCA的复杂度问题,特征分解是 O(n^3) 复杂度,
如果仅需要前M个最大的特征值以及特征向量,那么有一些算法可达到O(M*D^2)复杂度

PPCA

PPCA比起传统PCA,有一点优势就是利用了概率分布。因为我们的数据即使在某个低维子空间上,也不可能分布在整个子空间,而是只处在其中一个小区域。概率模型就很好地利用了这一点。当然,除了生成数据之外,概率模型更大的优势还是通过观察变量,也就是手里的数据,去推断参数也就是 W W W μ \mu μ σ 2 \sigma^2 σ2是什么。这就要利用一些统计推断方法,比如最大似然法。但想用最大似然,必须先知道似然函数是什么。
x = W z + μ + ϵ x=Wz+{\mu}+{\epsilon}

  • 0
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
PCA降维和深度学习降维是两种不同的降维方法。 PCA降维是一种经典的线性降维方法,它通过找到数据中方差最大的方向,将数据投影到这个方向上,从而实现降维。PCA的目标是选择K个单位正交基,使得原始数据变换到这组基上后,各字段两两间协方差为0,而字段的方差尽可能大。PCA可以用于数据预处理,去除噪音和冗余信息,提高其他机器学习算法的性能。\[1\]\[2\]\[3\] 深度学习降维是一种基于神经网络的非线性降维方法。它通过训练一个深度神经网络,将高维数据映射到低维空间中。深度学习降维可以学习到数据的非线性结构和特征表示,能够更好地保留数据的信息。与PCA相比,深度学习降维可以处理更复杂的数据,但计算复杂度也更高。深度学习降维在图像处理、自然语言处理等领域有广泛应用。 #### 引用[.reference_title] - *1* [PCA降维](https://blog.csdn.net/sikh_0529/article/details/126806794)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^koosearch_v1,239^v4^insert_chatgpt"}} ] [.reference_item] - *2* *3* [深度学习不深度-PCAAutoEncoder](https://blog.csdn.net/jainszhang/article/details/82728274)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^koosearch_v1,239^v4^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值