RNA-Seq HISAT+ HTSeq + DESeq2流程及测序深度和质控问题讨论

最新推荐文章于 2022-09-12 15:34:30 发布

XiXicoming

最新推荐文章于 2022-09-12 15:34:30 发布

阅读量2k

点赞数

分类专栏： RNA-seq

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/theomarker/article/details/106583289

版权

本文介绍了基于BGISEQ500 SE50数据的RNA-Seq分析流程，包括HISAT2索引构建、比对、HTSeq计数及DESeq2差异基因分析。讨论了20M SE50读长对于基因定量的充足性，以及FastQC中碱基偏向性的处理。提供了参考资源链接。

摘要由CSDN通过智能技术生成

数据基于BGISEQ500 SE50 clean data约1.XG，20+M reads。

SE50 20M是否够？
对基因定量足够。理由：1，测序饱和度（随reads数增加，检测到的基因数随之上升。但当测序量达到一定区间后，基因数变化不明显）。 2，如果要检测isoform等信息，需要PE150或PE100（6G数据），但仅仅定量SE50 20M已经够了。
1，FastQC质控

FastQC -t 2 XX.fq.gz

’per base sequence content’几乎每个样本前15碱基存在bias。是否要剔除或剪切？
可以不剔除。随机引物引起的碱基偏向行本质是测序起始位置偏向性，任然是真实转录本序列，故比对时候不必剔除。
其他解释和讨论：
https://sequencing.qcfail.com/articles/positional-sequence-bias-in-random-primed-libraries/
http://www.360doc.com/content/18/0401/08/19913717_741943897.shtml

2, HISAT2 index

从HISAT2官网下载，这里下载mm10的index (http://daehwankimlab.github.io/hisat2/

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。