【machine learning】徒手实现PCA——训练篇

这篇博客详细介绍了PCA(主成分分析)的训练过程,包括PCA的主要思想、主元素的寻找方法以及如何快速计算主元素。PCA主要用于数据降维,通过找到数据方差最大的方向(即特征向量)来构建新的坐标系。文章提供了计算协方差矩阵和特征向量的技巧,并讨论了在数据量较大时的处理方法。
摘要由CSDN通过智能技术生成

最近在休假,没事儿写写总结。年龄大了,本来以前用的很熟,理解很到位的东西,现在一时半会儿却想不出来了。索性有时间做做总结,方便自己,也惠及大家~

这篇文章主要介绍PCA的训练。在百度文库、百科里看到许多相关的词条,但是有些方法细节写的并不是很清楚,如果读者需要代码实现,要走很多弯路。结合我的理解,以及在CMU的课程学习和实践,把一些细节详细记述一下。这里主要使用了矩阵的描述,其实是将很长很长的公式抽象化,而且读者看起来更容易理解。如果对矩阵描述不适应,那就先把整个文章读完,然后再按习惯的方法理解。

1、PCA想法

我在SVM那篇文章吐槽过外国人喜欢起一些高大上的名字,比如,支持向量机……这里又难免吐槽一下,主成分分析,主成分是个毛线?分析个毛线?好吧,我们是追求高B格的码农,就叫他PCA好了。可是一定要理解,PCA到底是在搞个啥。简而言之,PCA的作用在于——降维。降维是统计以及AI领域,特别是现在所谓大数据时代老生常谈的问题。PCA是产生比较早的,实现较为简单地,现在也用的颇为广泛地。另外还有ICA——独立元素分析,以及传说中得压缩感知,我会在本文最后面后话部分分析这几个方法的特点和优劣。

我们可以形象的理解PCA,可以分为三步:

1)依照数据的分布,重新建立新的正交坐标系;

2ÿ

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值