RNA-seq
过去对于整个细胞转录组水平的检测用的是表达谱芯片,而转录组测序技术(RNA-seq)的出现,改变了过去二十年的生物研究。
RNA-seq是生物学和生物医学研究中使用最广泛的技术之一,通常用于多个目标分析,包括阐明驱动不同生物学过程的关键转录网络以及多种疾病的诊断和预后表达特征的鉴定。
而数据归一化是RNA-seq处理流程的关键组成部分。
?
为什么要做数据归一化?
消除基因长度产生的误差
RNA-seq实验中众所周知的固有技术效果与基因长度有关:RNA(或cDNA)分子在测序之前先进行片段化,较长的转录本会比较短的转录本被剪切成更多的片段。因此,转录本的reads数不仅与其表达水平成正比,而且与其长度成正比。
这样来说,序列长的基因永远会被认为表达量较高,从而错误估计基因真正的表达量。为了消除基因长度产生的固有技术