平均表达量

文章介绍了如何使用R语言中的rtracklayer和dplyr库处理基因注释数据,筛选出pseudogene,然后计算细胞类型的平均基因表达,并生成包含pseudogene的热图表示。
摘要由CSDN通过智能技术生成
library(rtracklayer)
library(dplyr)
gtf <- rtracklayer::import("gencode.v19.annotation.gtf")
gtf<-as.data.frame(gtf)
a <- unique(gtf[,12])
b <-grep("pseudogene",a,value = TRUE)
a<-gtf %>% 
  dplyr::select(c("gene_type","gene_name")) %>% 
  distinct(gene_name,.keep_all = T) %>% 
  filter(gene_type %in% b)
write.table(a,file = "./all.txt",sep = "\t",col.names = T)

DefaultAssay(integrated) <- "RNA"
integrated<- ScaleData(integrated, verbose = FALSE)
expr <- integrated@assays$RNA@counts
expr <- floor(expr)
expr <- as.matrix(expr)
#计算分组基因表达量
Idents(integrated) <- "cell_type"#设置分组为cell_type
AverageExp <- AverageExpression(integrated)
expr <- AverageExp$RNA#取RNA slot
rm(AverageExp)##减小内存
allpseu = read.table("./all.txt")
type
#allpseu = read.table("/data/chenjn/gtf/allpseu.txt")
a <- allpseu$x
row <- rownames(expr)
useful <- intersect(row,a)
expr <- expr[useful,]
ey <- expr[which(rowSums(expr)>0),]
#生成颜色;
cmcolor <- cm.colors(256)
rowcolor <- rainbow(nrow(ey), start = 0, end = 0.3)
colcolor <- rainbow(ncol(ey), start = 0, end = 0.3)
#使用默认渐变色画热图;
heatmap(ey, scale = "column",
        RowSideColors = rowcolor,
        ColSideColors = colcolor,
        margins = c(6,10),
        xlab = NULL,
        ylab = NULL)

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值