一列多集合抽取我想要的那一列集合，且后面数据原封不动

最新推荐文章于 2024-05-18 16:59:05 发布

LN0717

最新推荐文章于 2024-05-18 16:59:05 发布

阅读量169

点赞数 2

文章标签： windows r语言

本文链接：https://blog.csdn.net/LN0717/article/details/136144715

版权

rm(list = ls())  #老规矩，先清空环境
cc<-read.table("135111_GSE.csv",header=T, sep=",")#这个是大集合哦
dd<-read.csv("mrna.csv",header=T, sep=",")#这个是小集合哦
rownames(cc) = cc[,1]#提取的csv第一列不是基因，是数字，我们要把我们的基因转化成我们的行
cc = cc[,-1]#删除我们的第一列，因为第一列已经变成行啦
dd=dd[dd$GENE_SYMBOL %in%  rownames(cc),]#dd中我们想要的那一列要包括在我们的大集合
cc[1:5,1:5]#查看一下
cc=cc[dd$GENE_SYMBOL,]#把我们想要的小集合弄进大集合里啦！
write.csv(cc,file="135111_mrnaGSE.csv")

大家只需要准备两份文件，一个是大集合，一个是我想要的小集合，大集合后面的数据肯定是原封保持不动的，要不然这个文章写的就没意义了，好啦，废话不多说，代码狗开干！

这是我准备的大集合：

这是我准备的小集合：

现在我们要做的就是大集合的第一列只要小集合里含有的基因，且后面几列的样本数据要对得上的，代码如下：

rm(list = ls())  #老规矩，先清空环境
cc<-read.table("135111_GSE.csv",header=T, sep=",")#这个是大集合哦
dd<-read.csv("mrna.csv",header=T, sep=",")#这个是小集合哦
rownames(cc) = cc[,1]#提取的csv第一列不是基因，是数字，我们要把我们的基因转化成我们的行
cc = cc[,-1]#删除我们的第一列，因为第一列已经变成行啦
dd=dd[dd$GENE_SYMBOL %in%  rownames(cc),]#dd中我们想要的那一列要包括在我们的大集合
cc[1:5,1:5]#查看一下
cc=cc[dd$GENE_SYMBOL,]#把我们想要的小集合弄进大集合里啦！
write.csv(cc,file="135111_mrnaGSE.csv")