关于RNA-seq 的那点事Count 数的标准化（一) RPKM 和FPKM，TPM及C(R）PM

最新推荐文章于 2024-06-07 12:30:32 发布

forever luckness

最新推荐文章于 2024-06-07 12:30:32 发布

阅读量2.6w

点赞数 11

分类专栏：生信技能树系列 R语言助力生信转录组学流程

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/leianuo123/article/details/112424578

版权

RNA-seq数据分析中，标准化Count数以消除基因长度和测序深度影响至关重要。常用方法包括RPKM、FPKM、TPM和C(R)PM。C(R)PM通过10^6标准化测序深度，但未考虑长度影响。Deseq2和edgeR常涉及CPM归一化，使用size factor进一步处理。此外，低丰度数据过滤和方差稳定变换（如VST和rlog）也是关键步骤。

摘要由CSDN通过智能技术生成

在这里插入图片描述

图片来自网络

我们都知道，在RNA seq 测序的过程中，我们测完序的最终目的是想根据测序的结果，最终分析得到差异基因以及潜在可能的功能分析，那么在进行差异分析以及对表达量进行分析的时候，对基因原始的Count 进行标准化，消除由于测序过程中单个基因自身的长度以及测序深度对数据的影响，是非常关键的一步。

RNAseq 测序，对于一个基因的Count 的计数呢，主要是基于匹配到该基因的外显子上的数目，那么按照这样理解的话，基因越长，比对到该基因(外显子)上的count 数就越多；而影响Count 的另一个因素就是测序深度，也就是该基因在测序的过程中每百万碱基检测到的数目，测序深度越大，那么本次RNA seq 中的所有read count都会增加，因在差异化以及探索表达量的过程中呢，需要对基因长度和测序深度进行标准化，消除这2个因素带来的影响，从而准确的确定基因在样本中是真实的差异表达。

那讲到了这里我们就需要来理解一下在RNA seq 的Count 数进行标准化的常用方法:

常用的方法，包括

1.C（R)PM究竟指什么呢?在常见的分析中，它出现在那里呢?

最低0.47元/天解锁文章

forever luckness

关注

11
点赞
踩
72

收藏

觉得还不错? 一键收藏
0
评论
关于RNA-seq 的那点事Count 数的标准化（一) RPKM 和FPKM，TPM及C(R）PM

图片来自网络我们都知道，在RNA seq 测序的过程中，我们测完序的最终目的是想根据测序的结果，最终分析得到差异基因以及潜在可能的功能分析，那么在进行差异分析以及对表达量进行分析的时候，对基因原始的Count 进行标准化，消除由于测序过程中单个基因自身的长度以及测序深度对数据的影响，是非常关键的一步。RNAseq 测序，对于一个基因的Count 的计数呢，主要是基于匹配到该基因的外显子上的数目，那么按照这样理解的话，基因越长，比对到该基因(外显子)上的count 数就越多；而影响Count 的...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。