强强联合的基因ID转换
https://www.jianshu.com/p/69364a601273
转换基因名称
library(org.Mm.eg.db)
library(“clusterProfiler”)
gas<-read.csv(‘C:/Users/Administrator/Desktop/ts11/gas9.csv’)
gene.df <- bitr(gas$gene, fromType = “ENSEMBL”, #fromType是指你的数据ID类型是属于哪一类的
toType = c(“SYMBOL”), #toType是指你要转换成哪种ID类型,可以写多种,也可以只写一种
OrgDb = org.Mm.eg.db)#Orgdb是指对应的注释包是哪个
mer=merge(x=gas, y=gene.df, by.x=“gene”, by.y=“ENSEMBL”, all.x=TRUE, all.y=FALSE)
dim(mer)
df3 <- mer
df5 <- aggregate(df3[41], df3[-41], FUN = function(X) paste(unique(X), collapse=","))###加入有NA字段的行被删除,所以sed -i ‘s/NA/NAiiiiiii/g’ * 再替换回去
dim(df5)
write.csv(df5,‘C:/Users/Administrator/Desktop/tss/gas9.csv’)
https://www.jianshu.com/p/da6ff8acac83
我们可以根据以下命令进行实现
df1 <- aggregate(df[7], df[-7], unique)
或者
df2 <- aggregate(df[7], df[-7], FUN = function(X) paste(unique(X), collapse=", "))
R将包含重复列的去重并合并值 - 简书 https://www.jianshu.com/p/da6ff8acac83