(五）PCA项目-利用PCA压缩图片

最新推荐文章于 2024-05-29 11:48:12 发布

高级生信攻橙诗~

最新推荐文章于 2024-05-29 11:48:12 发布

阅读量882

点赞数 1

分类专栏：机器学习项目文章标签：机器学习 pca降维

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ccc_bioinfo/article/details/109156821

版权

机器学习项目专栏收录该内容

5 篇文章 1 订阅

订阅专栏

上周浙大机器学习课程看到–PCA，今天开始总结一下基础知识，和简单的项目应用。
此前在生物信息学中也经常应用，最近一次的使用是在挑选样本时，看不同样本间的相关性/平行性。

【PCA的算法流程】

输入：n维样本集X=(x1,x2,…,xm)，要降维到的维数n’.
输出：降维后的样本集Y
1、对所有的样本进行中心化
2、计算样本的协方差矩阵
3、求出协方差矩阵的特征值及对应的特征向量
4、将特征向量按对应特征值大小从上到下按行排列成矩阵，取前k行组成矩阵P
5、Y=PX 即为降维到k维后的数据

注意：有时候，不指定降维后的n’的值，而是换种方式，指定一个降维到的主成分比重阈值t(0,1]。假如n个特征值为λ1≥λ2≥…≥λn，则n’可以通过下式得到：在这里插入图片描述

【PCA项目实践】

【PCA算法总结】
作为一个非监督学习的降维方法，它只需要特征值分解，就可以对数据进行压缩，去噪。因此在实际场景应用很广泛。为了克服PCA的一些缺点，出现了很多PCA的变种，比如为解决非线性降维的KPCA，还有解决内存限制的增量PCA方法Incremental PCA，以及解决稀疏数据降维的PCA方法Sparse PCA等。

PCA算法的主要优点有：

仅仅需要以方差衡量信息量，不受数据集以外的因素影响。
各主成分之间正交，可消除原始数据成分间的相互影响的因素。
计算方法简单，主要运算是特征值分解，易于实现。

PCA算法的主要缺点有：

主成分各个特征维度的含义具有一定的模糊性，不如原始样本特征的解释性强。
方差小的非主成分也可能含有对样本差异的重要信息，因降维丢弃可能对后续数据处理有影响。

高级生信攻橙诗~

关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
(五）PCA项目-利用PCA压缩图片

上周浙大机器学习课程看到–PCA，今天开始总结一下基础知识，和简单的项目应用。此前在生物信息学中也经常应用，最近一次的使用是在挑选样本时，看不同样本间的相关性/平行性。【PCA的算法流程】输入：n维样本集X=(x1,x2,…,xm)，要降维到的维数n’.输出：降维后的样本集Y1、对所有的样本进行中心化 2、计算样本的协方差矩阵3、求出协方差矩阵的特征值及对应的特征向量4、将特征向量按对应特征值大小从上到下按行排列成矩阵，取前k行组成矩阵P5、Y=PX 即为降维到k维后的数据注意：有时
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。