转换基因名称,构建seurat object

下载了个表达矩阵,发现基因名称是ENSG,转换为gene symbol再构建seurat对象。

fs=list.files(path = data_path,pattern="txt.gz$")

dat=lapply(fs, function(i){
  read.table(file.path(data_path,i),header = T,sep = "\t")
})

df = do.call(cbind,dat)

先把ENSG转换为gene symbol

oldnames <- rownames(df)
library(gprofiler2)
query1 <- gconvert(query = oldnames, numeric_ns= "ENTREZGENE_ACC",organism = "hsapiens", filter_na = FALSE)
# 把出现NA和重复的删除
newnames <- query1$name
newnames <- na.omit(newnames)
newnames <- newnames[which(!duplicated(newnames))]
# match只返回一个匹配的值 所以不会再出现重复的名字
pos <- match(newnames,query1$name)
# 提取子矩阵
df <- df[pos,]
rownames(df) <- newnames
# 构建seurat object
seurat_object<- CreateSeuratObject(counts = df)

完成! 

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值