假设检验 p-value,FDR,q-value

本文详细介绍了统计学中的p-value,解释了如何基于p-value做出假设检验的决策,并探讨了在多重假设检验中总体错误率FWER和错误发现率FDR的重要性。特别提到了Benjamini和Hochberg的FDR控制方法以及q-value的计算,强调了在寻找差异表达基因时如何控制错误发现的比例。
摘要由CSDN通过智能技术生成

1、p-value

单个假设检验中主要依靠p值(或统计量t)做出是否拒绝零假设H0的决定:p-value和预先设定的检验水准 α 做对比,如果p-value小于等于α,拒绝原假设,否则不拒绝原假设。

  • p-value:表征了在原假设成立的条件下,重复进行当前的试验,获得现有统计量t及其更极端情况的概率。
  • 给定检验水准 α 时,可得出对应的拒绝域;根据当前试验,可以计算出 p-value 。当 p-value 越小时,表示此时试验得到的统计量t越落在拒绝域。因此基于 p-value 的结果等价于基于t值的结果。因此,p-value 越小,拒绝原假设的信心越大。
  • 假阳性率:false positive rate, FPR.检验水准α给出了事先犯I-型错误的最大概率。

2、多重假设检验和总体错误率

在进行多重假设检验时,每个单独的假设都具有其本身的I型错误。在这种情况下,如果不进行任何的控制,犯I-型错误的概率会随着假设检验的个数而迅速增加。
多重假设检验中,广泛使用的错误控制指标是总体错误率(family-wise error rate,FWER),即至少出现一次错误地拒绝真实H0的可能性;FWER小于等于alpha。而研究者更关心的是能否尽量多地识别出差异表达的基因,并且能够容忍和允许总的拒绝中发生少量的错误识别,称为错误发现false discovery。即需要在错误发现和总的拒绝次数R之间寻找一种平衡,即在检验出尽可能多的候选变量的同时将错误发现率控制在一个可以接受的范围。

  • 错误发现率(False Discovery Rate,FDR),表示了在所有R次拒绝中错误发现的期望比例。错误发现率和假阳性率之间有着本质的差别。错
  • 5
    点赞
  • 29
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值