DESeq2归一化算法详解

DESeq2是一种用于RNA-Seq数据分析的R包,专注于raw count数据的差异分析。它通过计算sizefactor进行归一化,消除不同样本测序深度的影响。归一化过程包括log转换、计算基因均值、确定样本sizefactor以及调整原始表达量。在计算sizefactor时,会排除特定条件下的基因,确保结果的可靠性。归一化后的表达量便于进行样本间的比较和差异分析。
摘要由CSDN通过智能技术生成

欢迎关注”生信修炼手册”!

对于RNA_Seq而言,得到基因/转录本的定量结果仅仅是第一步, 只是对测序数据的汇总, 相同的工作也可以通过芯片直接得到。

无论是芯片也好,测序也罢,定量只不过是量化生物体内转录本的表达丰度,仅仅一个定量的结果并不能得到有效的生物学结论。为了回答生物学问题,还需要进行后续的差异分析。

由于定量的方式有很多种,比如raw  count, TPM, RPKM/FPKM 等,不同的定量方式其表达量的分布是不同的,所以差异分析时采用的软件与算法也会不同。本文介绍DESeq2这个R包,主要是针对raw count的定量结果,进行差异分析。

软件的官网如下

https://bioconductor.org/packages/release/bioc/html/DESeq2.html

DESeq2要求输入的定量结果为raw count形式,raw  count其实是根据reads数计算得到,所以要求必须全部是整数。

由于不同样本的测序量不完全相同,所以raw count无法在样本间直接比较,就是说同一个基因在样本A中的raw count大于样本B中的raw count , 并不意味这在A中的表达量就高,数值大可能是由于样本A测序的reads 总数大造成的。

为了在样本间进行差异分析,首先就需要对原始的raw count 表达量数据进行归一化。在DESeq2中,通过estimateSizeFactors函数为每个样本计算一个系数,称之为sizefactor, 示意如下


评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值