机器学习——PCA主成分分析法

最新推荐文章于 2024-10-20 06:48:47 发布

m0_72115396

最新推荐文章于 2024-10-20 06:48:47 发布

阅读量925

点赞数 22

文章标签：机器学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_72115396/article/details/135329215

版权

目录

一、主成分分析的概念

二、主成分分析的步骤

三、主成分分析PCA的简单实现

四、手写体识别数字降维

一、主成分分析的概念

主成分分析（PCA）是一种常用的数据降维方法，可以将高维数据转换为低维空间，同时保留原始数据中最具代表性的信息。在数学建模中，PCA可以应用于多个领域，例如金融、医学、自然语言处理等。

x∈R2⟶z∈R

在实际的数学建模中，降维操作是很常用的。

比如在图像处理中，如果要识别人脸，需要将每张图像表示为一个向量，每个元素代表图像中某个像素点的灰度值。由于每张图像的像素数量很大，可能成百上千万甚至更多，这会导致计算和存储成本非常高。

在这种情况下，可以使用PCA对这些向量进行降维，将每张图像表示为一个包含较少元素的向量，从而使得计算和存储成本大大降低。同时，PCA还能够从这些低维向量中提取出最具代表性的信息，以便于后续s的人脸识别任务。

二、主成分分析的步骤

1、数据预处理

中心化

X−Xˉ

2、求样本的协方差矩阵

m1X $X^T$

其中协方差描述两个数据的相关性，接近1为正相关，接近-1为负相关，接近0为不相关。两个数据的协方差计算公式如下：

cov(X,Y)= $\frac{\sum_{i=1}^{n}(X_i-\bar{X})(Y_i-\bar{Y})}{n-1}$

3、对协方差矩阵做特征值分解

4、选出最大的K个特征值对应的K个特征向量

5、将原始数据投影到选取的特征向量上

6、输出投影后的数据集

三、主成分分析PCA的简单实现

首先我们有一个二维数据长这样

我们需要将这个二维数据变为一维数据

代码如下：

1、首先载入数据查看我们数据的分布情况

对应上面的步骤和公式，将数据中心化

2、求协方差矩阵

3、求矩阵的特征值和特征向量

4、对特征值排序

5、取最大的top个特征值下标

最大的n个特征值对应的特征向量

6、特征空间的数据

四、手写体识别数字降维

引入sklearn中的手写数字识别

接下来部分代码如下

关注

22
点赞
踩
23

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

博客等级

码龄2年

8
原创

70
点赞

83
收藏

43
粉丝

关注

私信

热门文章

最新评论

朴树贝叶斯算法（垃圾邮件分类）
CSDN-Ada助手: 恭喜您写了这么有趣的博客！朴树贝叶斯算法在垃圾邮件分类中的应用确实是一个很有意思的话题。希望您能继续分享更多关于数据分析和机器学习的内容，或许可以探讨一下其他常见的分类算法，或者是实际案例的应用，这样可以让更多读者受益。期待您的下一篇作品！
朴树贝叶斯算法（垃圾邮件分类）
源码技术栈: 博主文章写的十分细致，结构严谨。感谢博主分享，期待博主持续输出好文，同时也希望可以来我博客指导我一番！
决策树（机器学习）
CSDN-Ada助手: 恭喜您写了第四篇博客，题为“决策树（机器学习）”。您对机器学习领域的持续关注和创作令人钦佩。通过您的文章，我对决策树在机器学习中的应用有了更深入的了解。在下一步的创作中，我建议您可以进一步探讨决策树算法在不同场景下的优势和限制，并与其他常用的机器学习算法进行比较。此外，您还可以提供一些实际案例，展示决策树算法在解决真实问题时的效果和应用价值。希望您能继续保持创作的热情，分享更多有关机器学习的知识。期待您的下一篇博客！谢谢您的分享！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5
机器学习——K-临近算法（KNN）
CSDN-Ada助手: 这是一篇很好的博客！你对K-临近算法的介绍非常清晰，让读者能够快速了解该算法的原理和应用。希望你能继续写下去，分享更多的机器学习知识。除了K-临近算法本身，你还可以介绍一些相关的扩展知识和技能，例如特征选择和特征工程。在实际应用中，选择合适的特征对于算法的性能和准确性非常重要。此外，你还可以探讨一些优化KNN算法的方法，如使用KD树来加速搜索过程。继续努力，期待看到你未来的博客！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2
性能评估指标（精确率、召回率、ROC、AUC)
CSDN-Ada助手: 恭喜你写了第三篇博客，题目“性能评估指标（精确率、召回率、ROC、AUC)”非常吸引人！你对这些性能评估指标的解释非常准确，让读者能够清晰地理解它们的概念和应用。在未来的创作中，我建议你可以进一步探讨如何在实际项目中选择和应用这些指标，以及如何解释评估结果。这样的深入分析将使你的博客更加实用和有趣！期待你的下一篇作品！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。