HT相关概念整理

HT相关概念
显著性水平:1.判断界限的小概率标准,小于给定标准的概率区间称为拒绝区间。
2.若属于接受区间,则说原假设成立,无显著性差异;属于拒绝区间,拒绝原假设认为有显著性差异(不可能发生的小概率事件发生了,这不正常,拒绝原假设)
3.原假设正确,却错误的拒绝,犯这种错误的概率用α表示(决策中所面临的风险)。α表示拒真的概率。1-α 为置信度,区间估计的可靠性。α一般取0.05/0.01,表明接受原假设时正确的可能性为95%/99%。
4.显著性水平的意义是在一次实验中小概率事件发生的可能性大小
显著性差异就是实际样本统计量的取值和假设的总体参数的差异超过了偶然因素的作用范围,说明还有系统性因素发生,因为否定某种条件不起作用的假设。而原假设时假定样本统计量与总体参数的差异都是由随机因素引起的,不存在条件变动因素。

校正P值的方法
Bonferroni:如果检验1000次,我们就讲阈值设定为5% / 1000 = 0.00005;即使检验1000次,犯错误的概率还是保持在N×1000 = 5%。最终使得预期犯错误的次数不到1次,抹杀了一切假阳性的概率。但是该方法虽然简单,但是检验过于严格,导致最后找不到显著表达的蛋白(假阴性),也就是说拒绝域太小,本来错的当成正例接受了。
BH法:FDR的计算方法:1.对所有的P值从小到大排序 2.对于一个给定的显著性水平a(通常为0.05),找到最大的K值,使得P(k)<=ak/m;3.拒绝P1Pk的无效假设H0,即P1Pk的表达量存在显著差异——对P值进行校正 转换为q-value,q=pn/rank,rank是P值从小到大排序后的次序
貌似第三种?->
FDR的计算相当简单,包括以下几步:
1.对p值进行从小到大的排序,标记上序号1~n;
2.其中,最大的FDR(不考虑重复则为第n位)等于最大的p值;
3.对于n-1位的FDR,取下面两者的较小值:
上一步(第n位)计算得出的FDR值;
p值*n/(n-1)
4.不断迭代第三步(n-2,n-3…),直至计算到最小p值对应的FDR。(计算到第一个P值,倒着来计算P值)

FDR,伪发现率,意义是错误拒绝(拒绝原假设(真的假设))的个数占所有被拒绝的原假设个数的比例的期望值。拒真率。
拒真/(拒真的和本来应该被拒绝的)。 拒真:假设成立但是拒绝了
第一列:实际上是真的(实际上是应该被拒绝的????这是positive????TP是假设不成立应该被拒绝的,FP是假设成立但是错误被拒绝的)
假阳性(FP)实际上是反例被错误标为正例,所以正例是,被拒绝。

在这里插入图片描述
在这里插入图片描述

FDR=V/(V+S)
零假设正确和不正确===拒绝和不拒绝零假设 零假设正确,拒绝:V(FP);零假设不正确,拒绝:S(TP)
我们在处理宏基因组差异基因的选择时,需要对两个样本的每个基因进行一次假设检验。如果我们有m个基因,那么我们就要做m次假设检验。(比较两个样本共同的基因??)每一次的假设检验的零假设H0为:两个样本的这个基因没有显著性差异。其中有m0个零假设是正确的,即这个基因在两个样本中确实没有显著性差异;但有m1=m-m0个零假设是错误的,即两个样本的这个基因是有显著性差异。m次检验之后,被拒绝的零假设的个数记为R。为了方便记忆,可用一张表格来表示假设检验的结果,如上。(cummin函数)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值