标准化
标准化的原因
芯片实验中存在大量干扰因素,标准化可以削弱这些干扰因素,使得实验条件下的测量可以相互比较。
常见干扰因素:芯片杂交的RNA总量不一致、芯片表面不平整、探针非特异性结合、杂交条件不一致。
注意,limma包的说明里面提供了两点建议。一,如果要进行探针过滤(filter),最好在进行标准化之后再过滤。二,如果要在后续分析中使用limma包,请不要进行基于方差(variance)的过滤,否则会影响方差分布,从而导致limma包处理产生糟糕的结果(poor results)。
标准化的方法
芯片数据的标准化可以分为四个步骤:
1、background correction
移除非特异结合等背景噪音,有助于检出较低丰度下的倍数差异检出
2、normalization
消除测量间的非实验误差,使得实验条件下的测量可以相互比较。
3、pm correction
对pm探针的荧光值进行修正
4、summarization
将前面得到的荧光强度值从探针水平汇总到探针组水平
下面提供三类常见的标准化方法。
1 使用expresso进行标准化
affy包提供了expresso函数进行标准化,用户可以自定义每一步使用的方法。oligo读取的数据也可以用expresso函数进行标准化。expresso函数提供的标准化方法如下。
> bgcorrect.methods()
[1] "bg.correct" "mas""none" "rma"
> normalize.methods(CLLbatch)
[1] "constant" "contrasts" "invariantset" "loess" "methods""qspline"
[7] "quantiles" "quantiles.robust" "quantiles