genefilter
常用函数
1 findLargest
功能:只留下检验统计量最大的探针,舍弃其他重复探针。
返回值:包含探针名称的list。
findLargest(gN, testStat, data = "hgu133plus2")
参数 | 注释 |
---|---|
gN | 包含所有探针名称的list。 |
testStat | 包含检验检测统计量的list,长度和gN一致。 |
data | 芯片标识。 |
2 genefilter
功能:使用自定义的统计检验方法检验探针是否通过测试。
返回值:一个包含逻辑值的list,长度和探针数目一致。通过测试的返回TRUE,不通过的返回FALSE。
genefilter(expr, flist)
参数 | 注释 |
---|---|
expr | 表达矩阵。 |
flist | 包含统计检验方法的list。 |
3 kOverA
功能:判断探针是否至少在K个样本中超过A。
返回值:逻辑值。通过检验为TRUE,不通过为FALSE。
kOverA(k, A=100, na.rm=TRUE)
参数 | 注释 |
---|---|
A | 要超过的值。 |
K | 至少几个样本。 |
na.rm | 是否移除NA值。默认为TRUE。 |
4 nsFilter
功能:除去低变异或低信号的探针。
返回值:一个包含筛选后的eset和filter.log的list。
|————–|
|eset|过滤后的ExpressiongSet|
|filter.log|每一步过滤掉多少探针的记录|
nsFilter(eset, require.entrez=TRUE,
require.GOBP=FALSE, require.GOCC=FALSE,
require.GOMF=FALSE, require.CytoBand=FALSE,
remove.dupEntrez=TRUE, var.func=IQR,
var.cutoff=0.5, var.filter=TRUE,
filterByQuantile=TRUE, feature.exclude="^AFFX", ...)
参数 | 注释 |
---|---|
require.entrez | 若为TRUE,过滤掉没有ENTREZ ID的探针。默认为TRUE。 |
remove.dupEntrez | 若为TRUE,当几个探针对应统同一ENTREZ ID的时候,留下 var.func 值最大的探针,其余过滤。默认为TRUE。 |
var.func | 用于过滤的统计参数。默认为IQR。 |
var.cutoff | 截断值。默认为0.5,即过滤掉50%的基因。 |