RNA-Seq HISAT+ HTSeq + DESeq2流程 及测序深度和质控问题讨论

数据基于BGISEQ500 SE50 clean data约1.XG,20+M reads。
  • SE50 20M是否够?
    对基因定量足够。理由:1,测序饱和度(随reads数增加,检测到的基因数随之上升。但当测序量达到一定区间后,基因数变化不明显)。 2,如果要检测isoform等信息,需要PE150或PE100(6G数据),但仅仅定量SE50 20M已经够了。
    1,FastQC质控
FastQC -t 2 XX.fq.gz
  • ’per base sequence content’几乎每个样本前15碱基存在bias。是否要剔除或剪切?
    可以不剔除。随机引物引起的碱基偏向行本质是测序起始位置偏向性,任然是真实转录本序列,故比对时候不必剔除。
    其他解释和讨论:
    https://sequencing.qcfail.com/articles/positional-sequence-bias-in-random-primed-libraries/
    http://www.360doc.com/content/18/0401/08/19913717_741943897.shtml
2, HISAT2 index

从HISAT2官网下载,这里下载mm10的index (http://daehwankimlab.github.io/hisat2/

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值