【机器学习基础】PCA主成份分析算法

最新推荐文章于 2024-02-02 16:49:32 发布

codedrinker

最新推荐文章于 2024-02-02 16:49:32 发布

阅读量448

点赞数 2

分类专栏：深度学习文章标签：机器学习深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/sunjinbat/article/details/107868470

版权

深度学习专栏收录该内容

2 篇文章 0 订阅

订阅专栏

特征提取和特征选择（Feature Extraction and selection）

特征提取：主成分分析 PCA：principal component analysis 1947

特征选择：自适应提升算法 AdaBoost 1995

所需数学知识：协方差线性代数矩阵求导

特征提取问题描述：

特征选择问题描述：

对于特征提取问题，nn其实也是个提取问题，这里的PCA就类似于一个单层的有M

个神经元的神经网络。

主成分分析的流程：寻找使方差最大的方向并在该方向投影

这里ai是一个向量，P是样本的个数。

A是M*N的矩阵可以看做是M个行向量，

X是一个样本维度是N维。

是一个向量，P是样本的个数。

问题转化如下：

为什么最大化的问题转化成：这里减去均值的意思就是相当于找一个坐标系，在该坐标系下首先找一个向量ai，所有样本在新的坐标系下有了新的坐标，ai和所有样本的内积即为在新的坐标下的投影，然后求和求最大方差。

但是

也即

整理一下，原问题转化如下：是一个求条件极值问题，拉格朗日数乘法。

这里涉及到矩阵求导。

此时的a1就是我们求的第一个向量，二维已经可以降到一维。

对于高维情况，继续要求特征值和特征向量，找其他的方向投影最大。

这个方向要求和a1正交。

问题转化为如下：

面证明bata等于0

同样的道理可以求A矩阵其他向量。

PCA算法总结如下：计算样本得到的协方差计算特征值和特征向量，并排序。

样本本来是N * P 转化成了 M * P的矩阵。

对于样本的特征值也可以用SVD快速求出。

图片来自于浙江大学胡浩基教授上课的板书。侵权删。

关注

2
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。