feature R语言进行表达定量

最新推荐文章于 2024-07-21 14:34:30 发布

刘融晨

最新推荐文章于 2024-07-21 14:34:30 发布

阅读量375

点赞数 9

文章标签： r语言数据库开发语言

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_73361516/article/details/134993969

版权

准备bam文件、gtf/gff文件

library(Rsubread)
library(limma)
library(edgeR)
library(tidyverse)
library(readr)
sample_name <- read_csv("sample.txt", col_names = FALSE) %>% pull(var = 1) %>% .[1:4] %>% str_sub(1,11)

for (i in 1:length(sample_name)) {
  
  sample = sample_name[i]
  bamFile = str_c("~/Program/tpm/",sample,".bam",sep = "")
  gtfFile = "~/Program/tpm/flax_trans.gtf"
  nthreads <- 16
  outFilePref <- "~/Program/tpm/"
  
  outStatsFilePath  <- str_c(outFilePref,sample, '.log',  sep = '')
  
  outCountsFilePath <- str_c(outFilePref,sample, '.count',  sep = '')
  
  fCountsList = featureCounts(bamFile,
                              annot.ext=gtfFile,
                              isGTFAnnotationFile=TRUE,
                              nthreads=nthreads,
                              isPairedEnd=F)
  dgeList = DGEList(counts=fCountsList$counts, genes=fCountsList$annotation)
  fpkm = rpkm(dgeList, dgeList$genes$Length)
  tpm = exp(log(fpkm) - log(sum(fpkm)) + log(1e6))
  
  write.table(fCountsList$stat, outStatsFilePath, sep="\t", col.names=FALSE, row.names=FALSE, quote=FALSE)
  
  featureCounts = cbind(fCountsList$annotation[,1], fCountsList$counts, fpkm, tpm)
  colnames(featureCounts) = c('gene_id', 'counts', 'fpkm','tpm')
  write.table(featureCounts, outCountsFilePath, sep="\t", col.names=TRUE, row.names=FALSE, quote=FALSE)
  
}

关注

9
点赞
踩
8

收藏

觉得还不错? 一键收藏
打赏
1
评论
feature R语言进行表达定量

准备bam文件、gtf/gff文件。
复制链接

扫一扫

刘融晨 CSDN认证博客专家 CSDN认证企业博客

码龄2年

26: 原创

135万+: 周排名

7万+: 总排名

1万+: 访问

: 等级

390: 积分

89: 粉丝

123: 获赞

20: 评论

124: 收藏

私信

关注

热门文章

分类专栏

wgcna多循环分析 1篇

最新评论

利用eggnog结果构建自己的OrgDB包
shimin0111: 请问构建之后怎么用这个包做KEGG的富集呢？
非模式生物自建库后进行GSEA分析
z451906625: 您好，富集分析的数据示例可以展示一下吗，十分感谢
利用eggnog结果构建自己的OrgDB包
刘融晨: unique
利用eggnog结果构建自己的OrgDB包
weixin_45120004: 请问构建gene2go（包含重复）等文件后，在创建注释包时显示有重复行该怎么办呀，我看过后发现是，例如两行的gene_id是同一个id，go id也是一样的，但缺对应了2个不同的level2，这种应该如何呀？删除还是保留呢？
gsea自定义基因集分析
CSDN-Ada助手: 恭喜您撰写了第20篇博客，题为“gsea自定义基因集分析”。您的持续创作精神令人钦佩！在您的博客中，我发现了许多有价值的信息，尤其是关于自定义基因集分析的内容。您的文章深入浅出，让我对这个领域有了更清晰的理解。接下来，我想向您提出一些建议，以便您在创作中不断进步。或许您可以分享一些实际案例或者提供一些实用的技巧，帮助读者更好地应用gsea自定义基因集分析。此外，您还可以尝试将其与其他相关领域进行结合，探索更多可能性。无论如何，我期待着您未来的博客，相信您一定会继续带给我们更多有益的知识。祝您创作愉快！

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

刘融晨 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。