RNA-Seq HISAT+ HTSeq + DESeq2流程 及测序深度和质控问题讨论

本文介绍了基于BGISEQ500 SE50数据的RNA-Seq分析流程,包括HISAT2索引构建、比对、HTSeq计数及DESeq2差异基因分析。讨论了20M SE50读长对于基因定量的充足性,以及FastQC中碱基偏向性的处理。提供了参考资源链接。
摘要由CSDN通过智能技术生成
数据基于BGISEQ500 SE50 clean data约1.XG,20+M reads。
  • SE50 20M是否够?
    对基因定量足够。理由:1,测序饱和度(随reads数增加,检测到的基因数随之上升。但当测序量达到一定区间后,基因数变化不明显)。 2,如果要检测isoform等信息,需要PE150或PE100(6G数据),但仅仅定量SE50 20M已经够了。
    1,FastQC质控
FastQC -t 2 XX.fq.gz
  • ’per base sequence content’几乎每个样本前15碱基存在bias。是否要剔除或剪切?
    可以不剔除。随机引物引起的碱基偏向行本质是测序起始位置偏向性,任然是真实转录本序列,故比对时候不必剔除。
    其他解释和讨论:
    https://sequencing.qcfail.com/articles/positional-sequence-bias-in-random-primed-libraries/
    http://www.360doc.com/content/18/0401/08/19913717_741943897.shtml
2, HISAT2 index

从HISAT2官网下载,这里下载mm10的index (http://daehwankimlab.github.io/hisat2/

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值