FDR校正的程序实现及严格程度对比

最新推荐文章于 2024-04-05 15:18:40 发布

Dr. Yuchen Liu

最新推荐文章于 2024-04-05 15:18:40 发布

阅读量2.6w

点赞数 11

分类专栏： MATLAB函数详细介绍文章标签： matlab 函数 R

本文链接：https://blog.csdn.net/machinelearning_er/article/details/71786074

版权

MATLAB函数详细介绍专栏收录该内容

4 篇文章

订阅专栏

FDR校正的程序实现及严格程度对比

前言

做统计分析就离不开P value<0.05，而写过科研文章的人也都知道没有经过FDR校正的P值就像一盘散沙，不用风吹，走两步自个儿就散了。那么FDR校正这个让人又爱又恨的东西是什么呢？又是如何实现呢？

原理是这样：设总共有m个候选基因，每个基因对应的p值从小到大排列分别是 p(1),p(2),...,p(m),则若想控制fdr不能超过q（如0.05），则只需找到最大的正整数i，使得 p(i)<= (i*q)/m.然后，挑选对应p(1),p(2),...,p(i)的基因做为差异表达基因，这样就能从统计学上保证fdr不超过q。计算方法参考：http://stat.ethz.ch/R-manual/R-devel/library/stats/html/p.adjust.html

没听明白？再说简单点就是对统计分析结果产生的P值做一次筛选，对原始P值<0.05这个显著性的真实性用FDR校正后的新P值做判定。

下面对FDR校正的程序实现基于MATLAB和R分别进行介绍。

(一) MATLAB实现

mafdr函数

1. FDR = mafdr(PValues);

%最简单的实现方式，基于Storey procedure ( introduced by Storey, 2002)，适用于P值数量>1000的情况，否则原则上会崩溃。我用MATLAB测试过，会出现warning，但不会报错。严格程度较低，如果你的 ttest P值不是特别显著（0.01-0.05），可以用这个试试，或许可以过FDR校正.

2.FDR=mafdr(P,'BHFDR', true);

%基于linear step-up (LSU) procedure (introduced by Benjamini and Hochberg, 1995)。最常见的FDR校正方式，严格程度较高，但比
Bonferroni校正低，适用于 ttest P值显著（<0.01）。

注：

BHFDR的计算过程

1. 将一系列的p值按照从大到小排序，然后利用下述公式计算每个p值所对应的FDR值：

公式：FDR = p * (n/i)， p是pvalue，n是p值个数，最大的P值的i值为n，第二大则是n-1，依次至最小为1。

2. 将计算出来的FDR值作为新p值，如果某一个p值所对应的FDR值大于前一位p值（更大的p值）所对应的FDR值，则放弃公式计算出来的FDR值，选用与它前一位相同的值，因此会产生连续相同FDR值的现象；反之则保留计算的FDR值。

3. 返回p值对应的FDR值。

3.FDR=mafdr(P,'Lambda', [0.01:0.01:0.95]);

%指定调整参数λ，用于估计零假设为真的先验概率，Lambda Value可以是：（1）0-1内任意一值（2）4个以上序列，或以示例的矩阵形式：[first:incr:last]，mafdr函数自动选择最优参数。严格程度比1略低，我用第一个不能过校正但是用这个居然可以过，为FDR苦恼得同志们可以被解救了。

4.FDR= mafdr(P, 'Method', MethodValue, [0.01:0.01:0.95]);

%对选择最优参数lambda的方法进行选择，'bootstrap' (default)，'polynomial'。第3种方法的延伸。

(二) R语言实现

p<-c(p1,p2,...,pn) %括号内载入P值序列，","间隔

p.adjust(p,method="method value",length(p)) %通过修改method value变换FDR方法，包括"holm","horchberg","hommel","bonferroni","BH","BY","fdr"。从严格程度上"bonferroni"最可怕，"BH","fdr"与MATLAB的1,2相同，其余在之间。

FDR校正的程序实现先说到这里，如果你有其他的方法请在下方留言评论或发邮件与我交流，我的邮箱是liuyuchen0020@163.com