rm(list = ls()) #老规矩,先清空环境
cc<-read.table("135111_GSE.csv",header=T, sep=",")#这个是大集合哦
dd<-read.csv("mrna.csv",header=T, sep=",")#这个是小集合哦
rownames(cc) = cc[,1]#提取的csv第一列不是基因,是数字,我们要把我们的基因转化成我们的行
cc = cc[,-1]#删除我们的第一列,因为第一列已经变成行啦
dd=dd[dd$GENE_SYMBOL %in% rownames(cc),]#dd中我们想要的那一列要包括在我们的大集合
cc[1:5,1:5]#查看一下
cc=cc[dd$GENE_SYMBOL,]#把我们想要的小集合弄进大集合里啦!
write.csv(cc,file="135111_mrnaGSE.csv")
大家只需要准备两份文件,一个是大集合,一个是我想要的小集合,大集合后面的数据肯定是原封保持不动的,要不然这个文章写的就没意义了,好啦,废话不多说,代码狗开干!
这是我准备的大集合:
这是我准备的小集合:
现在我们要做的就是大集合的第一列只要小集合里含有的基因,且后面几列的样本数据要对得上的,代码如下:
rm(list = ls()) #老规矩,先清空环境
cc<-read.table("135111_GSE.csv",header=T, sep=",")#这个是大集合哦
dd<-read.csv("mrna.csv",header=T, sep=",")#这个是小集合哦
rownames(cc) = cc[,1]#提取的csv第一列不是基因,是数字,我们要把我们的基因转化成我们的行
cc = cc[,-1]#删除我们的第一列,因为第一列已经变成行啦
dd=dd[dd$GENE_SYMBOL %in% rownames(cc),]#dd中我们想要的那一列要包括在我们的大集合
cc[1:5,1:5]#查看一下
cc=cc[dd$GENE_SYMBOL,]#把我们想要的小集合弄进大集合里啦!
write.csv(cc,file="135111_mrnaGSE.csv")