phyper函数计算的显著性到底是什么?

最近做项目遇到一个有趣的问题:有135个肺癌患者,已知这些患者的临床表征(性别、年龄、是否吸烟等),在计算中发现了EGFR基因在队列中显著突变,现在想知道某个临床表征(比如吸烟)对EGFR基因的突变有没有显著的影响?

 

虽然已有文献证明了吸烟对于EGFR突变率和突变谱的影响,这里为了说明证明方法,还是以吸烟这个表征作为例子来举例说明。

 

这个问题类似于抽样检查的问题:工厂生产了N个零件,其中有M个零件是次品,在一次抽样调查中随机抽取n个零件,其中有m个零件是次品,问这次的抽样检查是否合格?也就是要通过抽样调查判断样本是否服从整体的分布。该抽样方法服从超几何分布,利用R中自带的phyper函数可以计算出p-value,这个p-value代表了抽样服从整体的可能性。

pvalue = phyper(m,M,(N-M),n,lower.tail=F)

计算出来的p-value需要进行FDR矫正,经过矫正后的FDR值如果小于0.05则否认原假设,认为抽样不符合整体,抽样结果不合格。

qvalue = p.adjust(pvalue,method='fdr')

回到开头的问题,有答案了吗?类比零件抽样调查的问题,我们需要找到队列总人数135,队列中含有EGFR突变的总人数90,队列中吸烟的人数70,吸烟人群中含有EGFR突变的人数54,然后利用phyper函数进行计算:

pvalue <- phyper(54,90,45,70,lower.tail=F)
qvalue <- p.adjust(pvalue,method='fdr')
qvalue
[1] 0.002012122

FDR=0.002说明吸烟人群的EGFR突变与队列整体的EGFR突变分布差异显著,证明吸烟对于EGFR突变有正向作用。

更多生信小知识关注:

 

  • 0
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值