机器学习数据预处理：数据降维之PCA

最新推荐文章于 2024-02-29 22:37:10 发布

zg1g

最新推荐文章于 2024-02-29 22:37:10 发布

阅读量1.6k

点赞数

分类专栏：机器学习文章标签：机器学习数据降维 PCA

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/daigualu/article/details/78725997

版权

本文介绍了机器学习数据预处理中的PCA（主成分分析）方法。PCA通过捕捉数据的主要成分，降低多维度数据的复杂性，同时减少信息损失。文章通过实例解释了主成分的选取标准，强调了方差在选择过程中的重要性，并预告了PCA操作的具体步骤。

摘要由CSDN通过智能技术生成

《实例》阐述算法，通俗易懂，助您对算法的理解达到一个新高度。包含但不限于：经典算法，机器学习，深度学习，LeetCode 题解，Kaggle 实战。期待您的到来！

01
—
回顾

到现在，已经总结了机器学习的：
回归算法之最小二乘方，脊回归，套索回归；
分类算法之逻辑回归，决策树分类，朴素贝叶斯决策，半朴素贝叶斯决策
聚类算法之高斯混合模型，解决这个模型选择了期望最大算法（EM算法）
介绍的以上算法都带有详细的原理介绍，例子阐述，代码实现（大部分都是自己编写不掉sklearn的包）

体会了机器学习的基本回归，分类，聚类到底是怎么回事后，该到了分析喂给这些算法的数据了，我们在之前介绍这些算法时，往往用到的数据都是已经预处理过的，比如做了归一化处理，做了降维处理等等。数据预处理做的好与坏，对我们最终问题的求解也是至关重要的，因此也是机器学习学习中的重要一个环节。

废话少说，下面介绍一个数据预处理常用的方法：数据主成分分析，简称PCA。

02
—
数据主成分分析的背景

现实中，我们要研究某个问题，比如预测一只股票的价格时，我们不想忽略每一个可能的影响因素，所以初步划定了100个影响股票价格的特征，再分析最近五年的这只股票的价格数据。这样多维度，大样本，会为预测股票的价格增加更多的筹码。

但是，这么多的维度一来给分析带来不便，二来某些维度可能存在相关性

最低0.47元/天解锁文章

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

zg1g CSDN认证博客专家 CSDN认证企业博客

码龄13年

674: 原创

6942: 周排名

1692: 总排名

99万+: 访问

: 等级

1万+: 积分

1553: 粉丝

1875: 获赞

96: 评论

1819: 收藏

私信

关注

热门文章

分类专栏

最新评论

.NET-TreeView选中节点失去焦点后颜色仍突出显示
Daniel的万事通杂货铺: https://blog.csdn.net/danielli/article/details/140701778 参考这个更完整。 // 背景色（原本的背景色，蓝色） Color bgColor = Color.FromArgb(0, 120, 215); Brush brush = new SolidBrush(bgColor); e.Graphics.FillRectangle(brush, new Rectangle(e.Node.Bounds.Left, e.Node.Bounds.Top, e.Node.Bounds.Width, e.Node.Bounds.Height));//背景色为蓝色或者//演示为绿底白字 e.Graphics.FillRectangle(Brushes.DarkBlue, e.Node.Bounds);
Python日志库logging：记录代码旅程的指南针
北风之神c: 总结的很全面，写得赞，博主用心了。此国产日志 https://nb-log-doc.readthedocs.io/zh_CN/latest 使用原生 loggng封装，兼容性和替换性100%,大幅简化logging的使用。 1、日志能根据级别能够自动变彩色。 1 2、print自动变彩色。 3、日志和print在pycahrm控制台的输出都自动可以点击跳转到文件和行号。 4、多进程日志切割安全，文件日志写入性能高。 5、入参简单，能一键自动记录到多种地方。 6、 nb_log 兼容包含loguru色彩模式,loguru只是nb_log的子集之一. 相比 loguru 有10胜。 pip install nb_log 。
爬虫小案例—雪球网行情中心板块数据抓取
白话机器学习: 内容丰富图文并茂，认真看完收获很大。思路清晰细节满满，支持大佬优质好文。
动态规划：括号知多少
于鹏帅_(:з」∠)_: 多加了一次2？
.NET-C#类库用regsvr32注册，找不到入口点的问题
sjsjsjzsdjcc: RegAsm : error RA0000 : “C:\Windows\SysWOW64\ntdll.dll”不是有效的 .NET 程序集，因此未能加载它如何解决

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。