STAR直接就可以输出readsCount,为什么还需要featurecounts?

这个问题很让人困惑,不少教程,先是STAR比对,然后featureCountsHTSeq再计算reads count。那么我们看看,什么时候需要这样做,什么时候不需要这样做?

STAR比对可以直接输出reads count

STAR比对参数很多,其中有一个quantMode,可以指定--quantMode GeneCounts输出STAR计算出的reads计数结果。(更多常用参数见 STAR比对线程也不是越多越好,多少是好?)

格式如下,有4列,各自解释如下:

trt_N061011.ReadsPerGene.out.tab: 每个基因的reads count,链非特异性RNASeq选第2列。

column 1: gene ID

column 2: counts for unstranded RNA-seq

column 3: counts for the 1st read strand aligned with RNA (htseq-count option -s yes)

column 4: counts for the 2nd read strand aligned with RNA (htseq-count option -s reverse)

N_unmapped    127    127    127
N_multimapping    3745    3745    3745
N_noFeature    21487    234292    234796
N_ambiguous    23935    5678    5571
ENSG00000178591    0    0    0
ENSG00000125788    0    0    0
ENSG00000088782    0    0    0
ENSG00000185982    0    0    0
ENSG00000125903    0    0    0
ENSG00000186458    0    0    0
ENSG00000272874    0    0    0
ENSG00000196476    71    33    38

这个结果与HTSeq的输出结果是完全一致的。所以我们如果是比对完之后未做转录本拼装,直接对已知基因(构建基因组索引时GTF中囊括的基因)进行定量时,完全不需要再次用featureCountsHTSeq再计算reads count

如果做了转录本拼装,对基因定量,需要HTSEQ/FEATURECOUNTS

假设我们用STAR比对后,做了转录本拼装,获得一个拼装比较后的注释文件assembeCompare2Ref.annotated.gtf,对新基因或有新转录本的基因进行定量时,就需要再次计算了。

下面代码显示的是htseq的计算方式,featureCounts改一下也适用。

for i in `tail -n +2 sampleFile | cut -f 1`; do 
    htseq-count -f bam -r pos -a 10 -t exon -s no -i gene_id -m union ${i}/${i}.Aligned.sortedByCoord.out.bam assembeCompare2Ref.annotated.gtf >${i}/${i}.readsCount
    grep -v '^__' ${i}/${i}.readsCount | sed "1 iGene\t${i}"  >${i}/${i}.readsCount2
done &

用软件,看别人分享的教程是一个快捷的方式。但也要看软件手册,看看哪些参数适合自己的物种、数据,再进行分析,不能别人用什么、怎么用,自己完全跟随。

即便是看完手册后,你发现不需要额外设置参数,直接套教程的代码就行,那也需要看手册!

看了才有底气,指导你的数据用这个参数是合理的,而不是懵懵懂懂、人云亦云~~~

往期精品(点击图片直达文字对应教程)

1740f057d4ebf2a55c26dd25343821e9.png

cedc6a48a16d5543eecaf8a60b6c882e.png

acc34aa02ab964f785f2b61a08fdcf8f.png

b7529f9c948f9f8577c8be5144fce21e.png

671aead9544928fe2a16cb43b111f731.png

c97f482e6861e8481a00faf57ecda939.png

61822c32dc70a3108dd54e1c13310801.png

1664addee131a6f355224ac564d2af31.png

76aefa5276d96554fd642444e47ce506.png

61922fdb35c3d4b1d8e276db56b7768d.png

790364fbe02580f891cd2abd4e8ce118.png

bf0a44df1e42d4d750adbfd4715cff0b.png

fb86ec781d919415a88de7b98e343725.png

e643a58c87aa06d98d22c5357ddafdfb.png

bc2f4854273f73ff53c803d58848021f.png

05b1c1d00c8f023c928a0a844c0b8831.png

4986d3b3feb7f72a6581fbb3d550e05e.png

b78ea23b1113eae83b55f122ef9bc086.png

821ed2cae7548577527075de71e8c043.png

e45e61ceb0fef65c62ef83b1395a4461.png

16b5f6223bb0e69bb10b096b45c6b04f.png

ef569c5ea9564ae8c28ef9666d1d3c1a.png

0825c87698c376162220d3c98b854c39.png

0df14f976dc16e8fecda6e05727c57c6.png

54d6db63a1223cb32d395cb7bb1b221d.png

77c0c81572f0e894ef57bb2847fca964.png

affaa6a2ceaec9803369d380174acc10.png

582b7ca1115371ca04a98e9ff486d4a2.png

机器学习

后台回复“生信宝典福利第一波”或点击阅读原文获取教程合集

0ae7b65b9e87305214bc0653ab2cffe8.png

ac6dd26241f1d247817c74ae08d4e4e9.png

63b04fd88e524bac26bd820e35f9564b.png

  • 2
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

生信宝典

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值