1. 区间估计
参数估计:用样本统计量来估计总体参数,包括点值估计和区间估计
点值估计:直接用样本统计量作为总体参数的估计值,这种方法简单方便,但是没有考虑抽样误差
区间估计:利用样本统计量,考虑抽样误差的大小,在一定的可信度1-α下估计总体参数所在的区间范围,得到的区间称为总体参数的置信区间,较小者称为置信下限,较大者称为置信上限,α一般取0.05或0.01
置信区间的含义
总体均数的95%置信区间的实际含义:如果从同一总体中重复抽取100份样本含量相同的独立样本,每份样本分别计算1个置信区间,在100个置信区间中,大约有95个置信区间包含了总体均数,有5个置信区间不包含总体均数
对于某一次估计的置信区间,置信度为95%,那么总体均数有95%的可能被包含在计算得到的区间内。
2. 假设检验的基本思想和步骤
假设检验的基本思想
对推断的目的进行假设,假设检验中一般有两个假设,原假设和备择假设,以原假设为条件,利用某种特定的分布或抽样规律推导抽得现有样本以及更极端情况下的样本的概率,根据小概率原理推断在原假设的条件下抽得现有样本是否可能发生,如果不能发生,则拒绝原假设,反之,认为原假设成立
假设检验的步骤
1)建立检验假设,确定检验水准
2)选定检验方法和计算检验统计量
3)确定P值,得出推断结论
3. 假设检验应注意的问题与两类错误
假设检验应注意的问题
1)要有严格的研究设计:个体应该有同质性,样本应该有代表性,组间具有可比性等
2)正确理解α水准和P值的意义:P<α的意义是按I型错误不超过α的概率拒绝原假设,接受备择假设;P值是指从原假设规定的总体中随机抽样,由样本数据计算出相应检验统计量等于或大于现有统计量值的概率。
3)正确理解结论的统计学意义:差异有统计学意义,是指样本统计量之间的差异并非仅有抽样误差偶然所致,而是由本质差别所致;差异无统计学意义,是指样本统计量之间的差值仅有抽样误差偶然所致的可能性较大,不能认为被推断的总体参数有差别,但不应误解为差别不大或肯定无差别;有统计学意义并不等于有实际临床意义,还应结合专业知识,考虑差值的平均水平是否达到或超过有临床实际意义的差值
4)假设检验的结论不能绝对化:假设检验的结论都是在一定概率下得到的,因此在推断结论时都有可能犯错误(I型错误或者II型错误)
5)单侧检验与双侧检验的选择:单侧检验比双侧检验多一个可利用的信息,因此单侧检验的检验效能高于双侧检验;对于同一组资料同一种方法,双侧检验所得的P值一般大于单侧检验所得的P值
I型错误与II型错误
当P≤α时,结论为拒绝原假设,但有可能是拒绝了事实上成立的原假设,这种错误称为I型错误,其最大的概率为α; 当P>α时,结论为不拒绝原假设,有可能没有拒绝事实上不成立的原假设,这种错误称为II型错误,其最大的概率为β,大小未知,可通过计算来估计。
当样本例数固定时,α增大,β减小,反之亦然。要想同时减小α和β,唯一的办法是扩大样本例数。
4. 置信区间与假设检验的关系
区间估计可用于回答假设检验的问题:如果未知的总体均数μ的95%置信区间包含了μ0, 就不拒绝H0
假设检验与置信区间是从两个不同目的出发并有密切关联的分析方法:假设检验推断总体参数有无质的区别,置信区间估计总体参数的大小,对同一资料,置信区间可比假设检验提供更多的信息,除了能完成假设检验的任务,还能提供两总体间差值有多大。
·end·
—如果喜欢,快分享给你的朋友们吧—
原创不易,欢迎收藏,点赞,转发!生信知识浩瀚如海,在生信学习的道路上,让我们一起并肩作战!
本公众号深耕耘生信领域多年,具有丰富的数据分析经验,致力于提供真正有价值的数据分析服务,擅长个性化分析,欢迎有需要的老师和同学前来咨询。
更多精彩
写在最后
转发本文至朋友圈,后台私信截图即可加入生信交流群,和小伙伴一起学习交流。
扫描下方二维码,关注我们,解锁更多精彩内容!
一个只分享干货的
生信公众号