机器学习（9）-PCA主成分原理与实现

最新推荐文章于 2023-12-19 15:22:21 发布

qq_38248958

最新推荐文章于 2023-12-19 15:22:21 发布

阅读量505

点赞数 1

分类专栏：机器学习（派神）文章标签：机器学习 PCA 主成分

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_38248958/article/details/83421589

版权

本文介绍了PCA主成分分析作为降维方法的原理和实践。PCA是一种无监督模型，用于在多个自变量的数据中提取新的主成分，以保留大部分方差。通过PCA，可以简化问题，便于分析和可视化。文中以wine数据集为例，展示了如何使用PCA进行降维，并结合逻辑回归进行分类，最终达到了97%的准确率。

摘要由CSDN通过智能技术生成

1.降维

简单粗暴的说:降低自变量的个数,可以简化问题,便于分析
比方说:在***多元线性回归***中提到的,并不需要所有的自变量,只需要挑选出几个最重要的自变量,再去进行分析
同时,这也有利于进行可视化分析

2.降维的方法

特征选择
1.反向淘汰 2.顺向选择 3.双向淘汰 4.信息量比较
思想是:原有的自变量不变,只进行提取
比如10个自变量,提取出5个进行分析
特征提取
1.PCA主成分 2.kernel PCA
就是提取的新的5个自变量已经不是原来的自变量了,即重新排列组合得到

3.PCA介绍

一种无监督模型,在具有m条自变量的数据中,PCA从中提取出p个新的自变量,p≤m,可以较好地解释数据自变量的方差(差异性)
注意:不关乎因变量是什么
其实,PCA也可以叫寻找最大方差的方向,将下图的两类数据运用一次PCA
在这里插入图片描述

得到下面的图,可以观察到,在PC1的方向上,数据的差异是比较大的,PC2的方向上数据的差异较小,那就可以说,PC1是最大方差的方向
在这里插入图片描述
找到了最大方差的方向之后,其他的数据就很可能是噪音了,便可以删除

最低0.47元/天解锁文章

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
3
评论
机器学习（9）-PCA主成分原理与实现

1.降维简单粗暴的说:降低自变量的个数,可以简化问题,便于分析比方说:在***多元线性回归***中提到的,并不需要所有的自变量,只需要挑选出几个最重要的自变量,再去进行分析同时,这也有利于进行可视化分析2.降维的方法特征选择1.反向淘汰 2.顺向选择 3.双向淘汰 4.信息量比较思想是:原有的自变量不变,只进行提取比如10个自变量,提取出5个进行分析特征提取1.PCA主...
复制链接

扫一扫

专栏目录

评论 3

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。