feature R语言进行表达定量

准备bam文件、gtf/gff文件

library(Rsubread)
library(limma)
library(edgeR)
library(tidyverse)
library(readr)
sample_name <- read_csv("sample.txt", col_names = FALSE) %>% pull(var = 1) %>% .[1:4] %>% str_sub(1,11)

for (i in 1:length(sample_name)) {
  
  sample = sample_name[i]
  bamFile = str_c("~/Program/tpm/",sample,".bam",sep = "")
  gtfFile = "~/Program/tpm/flax_trans.gtf"
  nthreads <- 16
  outFilePref <- "~/Program/tpm/"
  
  outStatsFilePath  <- str_c(outFilePref,sample, '.log',  sep = '')
  
  outCountsFilePath <- str_c(outFilePref,sample, '.count',  sep = '')
  
  fCountsList = featureCounts(bamFile,
                              annot.ext=gtfFile,
                              isGTFAnnotationFile=TRUE,
                              nthreads=nthreads,
                              isPairedEnd=F)
  dgeList = DGEList(counts=fCountsList$counts, genes=fCountsList$annotation)
  fpkm = rpkm(dgeList, dgeList$genes$Length)
  tpm = exp(log(fpkm) - log(sum(fpkm)) + log(1e6))
  
  write.table(fCountsList$stat, outStatsFilePath, sep="\t", col.names=FALSE, row.names=FALSE, quote=FALSE)
  
  featureCounts = cbind(fCountsList$annotation[,1], fCountsList$counts, fpkm, tpm)
  colnames(featureCounts) = c('gene_id', 'counts', 'fpkm','tpm')
  write.table(featureCounts, outCountsFilePath, sep="\t", col.names=TRUE, row.names=FALSE, quote=FALSE)
  
}

  • 9
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论
根据引用\[3\]所提到的,R语言中可以使用Boruta包进行机器学习特征筛选。Boruta是一个基于随机森林的变量筛选方法。它通过对特征进行混洗和原特征的重要性比较来确定特征的重要性。如果原特征的重要性比混洗之后还差,那么这个特征被认为是"不重要"的。如果混洗之后,重要性总是比原来的特征要低,那么这个特征被认为是"重要"的。Boruta包已经非常成熟,可以在R语言中使用,并且实现起来非常快速。你可以参考Boruta包的官方文档来了解更多关于使用Boruta进行机器学习特征筛选的详细信息。 #### 引用[.reference_title] - *1* *2* [R语言基于Boruta进行机器学习特征筛选(Feature Selection)](https://blog.csdn.net/zhongkeyuanchongqing/article/details/119615346)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insertT0,239^v3^insert_chatgpt"}} ] [.reference_item] - *3* [全自动机器学习:自动特征筛选(B)R语言自动特征工程实现](https://blog.csdn.net/weixin_29666489/article/details/111972845)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insertT0,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

刘融晨

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值