Analyzing RNA-seq data with DESeq2:输入数据和差异表达分析
基于DESeq2分析RNA-seq数据
Abstract
从 RNA-seq 中分析计数数据的基本任务是检测差异表达的基因。计数数据以表格的形式显示,每个样本报告了分配给每个基因的序列片段的数量。类似的数据也出现在其他分析类型中,包括comparative ChIP-Seq、 HiC、 shRNA screening和质谱法。一个重要的分析问题是,与条件内变异性相比,条件之间系统性变化的量化和推论统计学。软件包 DESeq2提供了用负二项广义线性模型
检验差分表达式的方法; dispersion 和logarithmic fold changes的估计包含了数据驱动的先验分布。本文解释了包的使用,并演示了典型的工作流。Bioconductor 网站上的 RNA-seq 工作流程涵盖了类似于本文的内容,但是速度较慢,包括从 FASTQ 文件生成计数矩阵。2包版本: 1.34.0
标准流程
注意: 如果你在已发表的研究中使用DESeq2
,请注明:
Love, M.I., Huber, W., Anders, S. (201