pca简单记录

最新推荐文章于 2023-06-14 11:05:32 发布

ninekwll0791

最新推荐文章于 2023-06-14 11:05:32 发布

阅读量106

点赞数

分类专栏：数据和presentation

本文链接：https://blog.csdn.net/weixin_40493805/article/details/117777201

版权

数据和presentation 专栏收录该内容

9 篇文章 0 订阅

订阅专栏

参考
https://blog.csdn.net/zhongkejingwang/article/details/42264479
https://blog.csdn.net/luoluo96321/article/details/112211217?ops_request_misc=%257B%2522request%255Fid%2522%253A%2522162330155516780262567693%2522%252C%2522scm%2522%253A%252220140713.130102334.pc%255Fall.%2522%257D&request_id=162330155516780262567693&biz_id=0&utm_medium=distribute.pc_search_result.none-task-blog-2_allfirst_rank_v2~rank_v29-7-112211217.first_rank_v2_pc_rank_v29&utm_term=pca%E4%B8%BB%E6%88%90%E5%88%86%E5%88%86%E6%9E%90&spm=1018.2226.3001.4187

1、pca的用途是什么？不是很清楚，只知道降维。

2、用途一：得到了数据，100条，但是数据属性有20个，太多了，可能有一些的相关性太大了，需要处理一下。怎么处理，数据在多维空间中（属性维度的空间）有个位置，我们看起来是乱的，比较集中的，但是如果经过数据转变，将20个属性空间变成8个或者6个这样的属性空间中(确切的说进行了线性变化，还是20维度的空间，后面解释。)，可以发现数据之间还是可以分的比较开的。（备注：降维了还可以分的开？有点晕！理解第一）

解释：生活中，人类是三维动物，只能感知到三维。如果一群人前后站成一排，一样高度的。然后在三维空间中是有数据点的位置。这个时候，需要你去识别有多少个人，怎么办？如果你从前面（x）看，是不知道有几个人的，但是从旁边（y）看，是可以识别得到的，第三维度（z）的就不管了先。说明前面维度（x）的信息是帮助不了你的，其实你只要旁边维度（y）的信息就ok了。
回到降维，只要从旁边，就可以识别区别，那么这个意思就是三维降维到一维就可以了，其他的维度信息我不需要的。因此是从3维降到了1维，其实还是3维度空间，只是后面的两个维度信息我不需要了。

3、原维度：m=20；新的维度：n=8。这个新的维度n是怎么得到的。
备注：理论上是从20个里面挑选了前8个，前面的特征值比较大，分的清楚，后面的就可以忽略了。
是通过m组合得到的，具体的要看例子，一般的例子太简单了。等着有好例子。

分析：从上面的解释可以看出，其实就是在某个维度上，看数据的方差最大，就选择那个维度投影。那么怎么知道哪个维度的方差大呢。由于是线性变换，因此要用到线性代数的知识。

4、待续中。。。。。