pca简单记录

参考
https://blog.csdn.net/zhongkejingwang/article/details/42264479
https://blog.csdn.net/luoluo96321/article/details/112211217?ops_request_misc=%257B%2522request%255Fid%2522%253A%2522162330155516780262567693%2522%252C%2522scm%2522%253A%252220140713.130102334.pc%255Fall.%2522%257D&request_id=162330155516780262567693&biz_id=0&utm_medium=distribute.pc_search_result.none-task-blog-2allfirst_rank_v2~rank_v29-7-112211217.first_rank_v2_pc_rank_v29&utm_term=pca%E4%B8%BB%E6%88%90%E5%88%86%E5%88%86%E6%9E%90&spm=1018.2226.3001.4187

1、pca的用途是什么? 不是很清楚,只知道降维。

2、用途一: 得到了数据,100条,但是数据属性有20个,太多了,可能有一些的相关性太大了,需要处理一下。怎么处理,数据在多维空间中(属性维度的空间)有个位置,我们看起来是乱的,比较集中的,但是如果经过数据转变,将20个属性空间变成8个或者6个这样的属性空间中(确切的说进行了线性变化,还是20维度的空间,后面解释。),可以发现数据之间还是可以分的比较开的。(备注:降维了还可以分的开?有点晕!理解第一)

解释:生活中,人类是三维动物,只能感知到三维。如果一群人前后站成一排,一样高度的。然后在三维空间中是有数据点的位置。这个时候,需要你去识别有多少个人,怎么办? 如果你从前面(x)看,是不知道有几个人的,但是从旁边(y)看,是可以识别得到的,第三维度(z)的就不管了先。说明前面维度(x)的信息是帮助不了你的,其实你只要旁边维度(y)的信息就ok了。
回到降维,只要从旁边,就可以识别区别,那么这个意思就是三维降维到一维就可以了,其他的维度信息我不需要的。因此是从3维降到了1维,其实还是3维度空间,只是后面的两个维度信息我不需要了。

3、原维度:m=20;新的维度:n=8。这个新的维度n是怎么得到的。
备注:理论上是从20个里面挑选了前8个,前面的特征值比较大,分的清楚,后面的就可以忽略了。
是通过m组合得到的,具体的要看例子,一般的例子太简单了。等着有好例子。

分析:从上面的解释可以看出,其实就是在某个维度上,看数据的方差最大,就选择那个维度投影。那么怎么知道哪个维度的方差大呢。由于是线性变换,因此要用到线性代数的知识。

4、待续中。。。。。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值