画出降维后的图片_PCA降维原理

PCA(主成分分析)是一种数据降维技术,用于简化数据集并保留方差贡献最大的特征。通过实例解释,PCA通过计算数据点到直线(主成分PC1)的最小距离和最大距离,找到最佳匹配。PCA的特征值、奇异值和特征向量描述了主成分的性质。PC1和PC2解释了数据的大部分变异度,可用于绘制降维后的图像。在降维前,需要对数据进行标准化处理。主成分数等于变量或样本数较小者,但不超过特征值大于0的PC数。
摘要由CSDN通过智能技术生成

PCA原理简介

为什么要用PCA?

维基百科介绍:主成分分析(英语:Principal components analysis,PCA)是一种分析、简化数据集的技术。主成分分析经常用于减少数据集的维数,同时保持数据集中的对方差贡献最大的特征。

说了和没说一样……我们还是通过一个简单的案例引出PCA的作用吧。

如果我们在6个小鼠样本中检测一个基因Gene1的表达

我们很容易看出来,基因Gene1在小鼠1-3中表达比较相似,而在小鼠4-6中表达比较相似

如果同时检测两个基因

我们可以将不同小鼠样本标记在二维坐标轴中,并且看出小鼠1-3的整体表达比较相似,而小鼠4-6的整体表达比较相似

将基因数目扩增到3个时候,我们依然可以通过三维坐标轴标记出不同样本的分布

但是如果将基因数目增加到4个或4个以上时候,很难继续增加坐标轴的维度来绘图(思维空间已经超出一般人的认知了)。

所以我们可以通过PCA的降维方法来处理这种4维或者多维数据,将其绘制为二维图像来比较不同样本之间的关系。

PCA原理

PCA是如果进行降维的呢?

PC1计算原理

首先我们只检测6个不同小鼠的2个基因,那么我们可以分别计算出所有小鼠Gene1和Gene2的平均值(

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值