各种假设检验用法汇总

今天看了一天的各类检验的区别,主要是自己会用到的T检验  Z检验  F检验  卡方检验   Fisher精确检验

得出以下结论(部分网上摘抄),不知道对错,请各位指教:


T检验与Z检验

T检验基本概念:


(以上来自道客吧吧,t检验计算公式

上式中,其实已经包括了Z检验。

T检验:主要用于总体样本未知,且样本容量小于30,

Z检验:一般用于大样本(即样本容量大于30)平均值差异性检验的方法。它是用标准正态分布的理论来推断差异发生的概率,从而比较两个平均数的差异是否显著。当已知标准差时,验证一组数的均值是否与某一期望值相等时,用Z检验。另外,对于Z检验我国的统计学教材大多采用U检验的说法。而国外英文统计学书籍,大多采用Z检验。

总结一句话就是,T检验和Z检验类似,如果总体样本未知,只能用T检验,如果样本量大,且总体样本已知,则使用Z检验,z检验和t检验都是均值差异检验方法,但t分布逐渐逼近z分布的特点,t检验的运用要比z检验更广泛,因为大小样本时都可以用t检验,而小样本时z检验不适用。


F检验

F检验(F-test),最常用的别名叫做联合假设检验(英语:joint hypotheses test),此外也称方差比率检验方差齐性检验


对F检验只是简单理解。

F检验又叫方差齐性检验。在两样本t检验中要用到F检验。从两研究总体中随机抽取样本,要对这两个样本进行比较的时候,首先要判断两总体方差是否相同,即方差齐性。若两总体方差相等,则直接用t检验,若不等,可采用t'检验或变量变换或秩和检验等方法。其中要判断两总体方差是否相等,就可以用F检验。F检验法是英国统计学家Fisher提出的,主要通过比较两组数据的方差S^2,以确定他们的精密度是否有显著性差异。至于两组数据之间是否存在系统误差,则在进行F检验并确定它们的精密度没有显著性差异之后,再进行t检验。


此处本人理解,T检验之前要进行F检验,指的是对两样本均数(mean)差别的显著性进行检验时,才会要进行F检验,来判断方差是否齐性。其它情况不用判断F检验,比如单样本检验和配对检验等情况不用,或样本是在同一总体中的两次抽样,也不用进行F检验



卡方检验与Fisher精确检验

卡方检验属于非参数检验的范畴,主要是比较两个及两个以上样本率( 构成比)以及两个分类变量的关联性分析。其根本思想就是在于比较理论频数和实际频数的吻合程度或拟合优度问题。

它在分类资料统计推断中的应用,包括:两个率或两个构成比比较的卡方检验;多个率或多个构成比比较的卡方检验以及分类资料的相关分析等。


其它情况不用判断F检验,比如单样本检验和配对检验等情况不用,或样本是两次抽样,也不用。

为便于说明情况,我将这位朋友做的课题简要介绍下:比较两种方法(方法A和方法B)治疗某种疾病的效果,设计的细节就不再赘述了。最终研究者发现29例患者接受了A法治疗,15例有效;27位患者接受了B法治疗,21位有效。如下表所示:


  对于此类数据的处理,相信大多数同行都会异口同声地说应该用卡方检验。的确,这种典型的四格表,且没有任何配对设计的元素,理论上讲是可以用卡方检验观察两个变量之间是否有关联的。经卡方检验后,得出P等0.042(具体的过程略,感兴趣者可阅读后续章节中关于如何在GraphPad Prism中进行卡方检验的内容)。于是研究者认定:B法优于A法!

  这个结论看起来是成立的,但事实真是如此吗?

  如果我们换一种统计方法,用Fisher确切概率法,会得到什么结果呢?笔者算了一下,P=0.054。这下问题来了:卡方检验和Fisher确切概率法的结果,该取哪一个呢?

  统计学教科书上通常会说:如果总样本量大于40,最小理论频数大于5,就应该用卡方检验;如果总样本量大于40,最小理论频数介于1和5之间,就应该使用卡方检验的校正公式;如果总样本量小于40,或(注意这个或字)最小理论频数小于1,就应该用Fisher确切概率法。在本案例中,总样本量为56,最小理论频数为:27×20/56=9.64,明显是大于5的,因此应采用卡方检验。

  这里穿插一段关于最小理论频数的计算方法,实际上就是最小的横排合计数据和最小的纵列合计数据的乘积再除以总样本量。在本案例中,横排合计数据只有两个(29和27),纵列合计数据也只有两个(36和20),总样本量是56,因此最小理论频数就是27×20/56=9.64。在多行多列表格中寻找最小理论频数的方法与此类似。

  实际上,在本案子里中,笔者认为应该采用Fisher确切概率法的结果,即两组治疗效果之间的差异无统计学意义。教科书上虽然说明了如果总样本量大于40,最小理论频数大于5,就应该用卡方检验,但部分教科书会遗漏一句很关键的话,即“如果采用卡方检验得到的P值在0.05附近时,应该用Fisher确切概率法”。本案例中,卡方检验得到的P值是0.042,属于0.05附近,因此应采用Fisher确切概率法进行统计。实际上,对于未进行配对的四格表的卡方检验,任何时候都应该以Fisher确切概率法结果为准。

(引自:个人图书馆所的文章:四格表统计中该用Fisher确切概率法还是卡方检验?)



Kolmogorov-Smirnov test

在统计学中,柯尔莫可洛夫-斯米洛夫检验基于累计分布函数,用以检验两个经验分布是否不同或一个经验分布与另一个理想分布是否不同。


评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值