【machine learning】徒手实现PCA——训练篇

最新推荐文章于 2022-04-07 12:13:56 发布

donnydcy

最新推荐文章于 2022-04-07 12:13:56 发布

阅读量1.4k

点赞数 1

分类专栏： Machine Learning 文章标签： Machine Learning PCA

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/donnydcy/article/details/38363341

版权

这篇博客详细介绍了PCA（主成分分析）的训练过程，包括PCA的主要思想、主元素的寻找方法以及如何快速计算主元素。PCA主要用于数据降维，通过找到数据方差最大的方向（即特征向量）来构建新的坐标系。文章提供了计算协方差矩阵和特征向量的技巧，并讨论了在数据量较大时的处理方法。

摘要由CSDN通过智能技术生成

最近在休假，没事儿写写总结。年龄大了，本来以前用的很熟，理解很到位的东西，现在一时半会儿却想不出来了。索性有时间做做总结，方便自己，也惠及大家~

这篇文章主要介绍PCA的训练。在百度文库、百科里看到许多相关的词条，但是有些方法细节写的并不是很清楚，如果读者需要代码实现，要走很多弯路。结合我的理解，以及在CMU的课程学习和实践，把一些细节详细记述一下。这里主要使用了矩阵的描述，其实是将很长很长的公式抽象化，而且读者看起来更容易理解。如果对矩阵描述不适应，那就先把整个文章读完，然后再按习惯的方法理解。

1、PCA想法

我在SVM那篇文章吐槽过外国人喜欢起一些高大上的名字，比如，支持向量机……这里又难免吐槽一下，主成分分析，主成分是个毛线？分析个毛线？好吧，我们是追求高B格的码农，就叫他PCA好了。可是一定要理解，PCA到底是在搞个啥。简而言之，PCA的作用在于——降维。降维是统计以及AI领域，特别是现在所谓大数据时代老生常谈的问题。PCA是产生比较早的，实现较为简单地，现在也用的颇为广泛地。另外还有ICA——独立元素分析，以及传说中得压缩感知，我会在本文最后面后话部分分析这几个方法的特点和优劣。

我们可以形象的理解PCA，可以分为三步：

1）依照数据的分布，重新建立新的正交坐标系；

2ÿ

最低0.47元/天解锁文章

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。