今天给大家讲讲芯片数据分析中常见的一些图的作用,让大家伙儿知道它们在BB些啥。
箱式图(Box plot)
基因芯片的原始数据是需要进行标准化处理的,主要目的是消除由于实验技术(如荧光标记效率、扫描参数的设置、空间位置的差异等)所导致的基因表达量的变化,让各个样本和平行实验的数据处于相同的水平,使得基因表达数据真实地反映测量样品的生物学差异。
箱式图反映的是标准化前后的基因表达数据情况,标准化后,整体数据的中位数会处于同一水平线上(见下方右图),这表明标准化的结果很好。常用的芯片间数据标准化方法有Quantile Normalization和Global Normalization。
散点图(Scatter plot)
芯片数据的散点图常用于评估两组数据总体分布集中趋势,是由芯片分析的原始数据经过标准化处理,转化为log2的对数后,在一个二维直角坐标系