r语言pca降维

对高维数据进行聚类(比如单细胞RNA测序数据)时常需要先降维,本文不讲原理直接给出一个使用PCA进行降维的例子:

var_thre = 0.6 方差比例阈值,这个值越大保留的特征数越多
#使用prcomp进行pca降维:
filtered_pca<- prcomp(filtered) #filtered是数据,其中行是样本列是特征
eigs<- (filtered_pca$sdev)^2 #计算出各个成分的方差
var_cum<- cumsum(eigs)/sum(eigs) #求各成分方差的累计比例
num_pc<- which.max(var_cum>= var_thre) 
#这里要注意,which.max返回一个向量中最大值的下标,如果有多个相同的最大值则返回
#第一个最大值的下标,由于var_cum>=var_thre为布尔向量,即分量为0和1,因此
#这里返回第一个1的下标,即返回第一个达到方差比例阈值的成分的下标,亦即需要
#保留的特征数
mat_pcs<- filtered_pca$x[, 1:num_pc] #降维后的矩阵
#为画图方便也可mat_pcs<- filtered_pca$x[,1:2]只取前两个成分
fviz_nbclust(mat_pcs, kmeans, method = "wss") #碎石图,用于确定聚类个数
km<- kmeans(mat_pcs, 3) #使用kmeans方法聚成3类
data_cluster<- km$cluster #记录下每个数据被分到哪一类

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
PCA(Principal Component Analysis,主成分分析)是一种常用的数据降维技术,可以帮助我们在高维数据中找到最主要的特征。在R语言中,我们可以使用`prcomp()`函数来进行PCA分析。 首先,我们需要准备数据数据应该是一个矩阵或数据框,其中每一列是一个变量,每一行是一个观测值。假设我们有一个环境因子的数据集,其中包含多个环境变量(如温度、湿度、光照等)和观测点(样本)。我们可以将数据读取到R中,并将其格式化为合适的矩阵或数据框。 然后,我们可以使用`prcomp()`函数进行PCA分析。这个函数接受一个数据矩阵或数据框作为输入,并返回一个PCA对象。我们可以将这个对象保存在一个变量中,以便后续的分析和可视化。 例如,假设我们的数据矩阵名为`env_data`,其中有4个环境变量和100个观测点。我们可以使用以下代码进行PCA分析: ```R pca_result <- prcomp(env_data) ``` 在这个例子中,`pca_result`是保存PCA结果的变量。我们可以使用`summary()`函数来查看分析的摘要信息,例如各主成分的方差解释比例和贡献度,以及每个环境变量在主成分中的负荷。 ```R summary(pca_result) ``` 我们还可以使用`plot()`函数将PCA结果可视化,例如绘制主成分的方差解释比例图和负荷图。 ```R plot(pca_result) ``` 这样,我们就可以使用R语言中的PCA函数(`prcomp()`)对环境因子进行分析,并得到相应的结果和可视化图形。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值