归一化处理tpm_RPKM, FPKM 与 TPM

本文详细介绍了RNAseq数据分析中的归一化处理,包括Reads Count、FPKM、RPKM和TPM的概念。重点讨论了TPM的优势,它在基因表达水平比较中的准确性,并通过实例展示了TPM与FPKM的计算过程。
摘要由CSDN通过智能技术生成

在对RNAseq进行分析时,总是被问到这3个概念的差别。那么这里我再梳理下自己对这3个概念的理解,希望可以帮助你。

01

Reads Count

在RNAseq数据中,raw reads count一般是指mapped到基因外显子区域的reads数目。比如说htseq,STAR,或者RSEM等NGS分析流程计算产生的counts值。其中RSEM(RNA-Seq by Expectation-Maximization),考虑到一条read 可能会匹配多个exon位置,故而其产生的为expected counts。

785a7ec52cfbb1aa64fee515403bbaa6.png

注:可以通过IGV对bam文件进行真实的reads数目观察

02

FPKM与RPKM

RPKM和FPKM在我刚读研究生的时候,就已经很常用了,不过随着生物信息学发展和算法改进,逐渐有些科学家认为这种对基因表达归一化的方法是够准确,所以现在差异分析方法都采用raw reads count值,作为输入数据,比如EdegR、DESeq2。

  • RPKM

RPKM(Reads Per Kilobase

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值