在统计学中,假设检验是评估某种特定情况下观察到的数据是否符合假设的一种方法。t检验和Z检验是两种常用的假设检验方法,分别用于比较均值差异以及比例差异。在医学统计中,t检验和Z检验经常被用于研究和比较不同治疗方法的效果,例如药物疗效、手术效果等。t检验和Z检验应用起来容易混淆,下面介绍下它们的区别。
一、t检验
t检验是用于比较两个总体的均值之间是否存在显著差异。在进行t检验时,不知道总体的标准差,而是使用样本标准差代替。t检验基于t分布,其形状与正态分布相似,但是在尾部较厚。随着样本量的增加,t分布逐渐接近正态分布。
t检验通常用于以下场景:1.比较两个独立样本的均值;2.比较两个配对样本的均值差异;3.验证样本均值与已知的总体均值之间是否存在显著差异;4.分析某一变量的变化是否显著。
实例1
以往通过大规模调查已知某地新生儿平均出生体重为3.30kg,从该地难产儿中随机抽取35名新生儿作为研究样本,平均出生体重为3.42kg,标准差为0.40kg,问该地难产儿出生体重与一般新生儿体重有无差异?
二、Z检验
Z检验又叫U检验,通常用于检验两个总体的均值或比例之间是否存在显著差异。在进行Z检验时,假设观察到的数据是正态分布的,并且已知总体的标准差。当已知总体标准差时,我们可以利用Z统计量进行假设检验。
Z检验通常用于以下场景:1.比较两个总体的均值或比例;2.验证样本均值或比例与已知的总体均值或比例之间是否存在显著差异;3.分析某一变量的变化是否显著。
实例2:
以往通过大规模调查已知某地新生儿平均出生体重为3.30kg,标准差为0.40kg,从该地难产儿中随机抽取35名新生儿作为研究样本,平均出生体重为3.42kg,问该地难产儿出生体重与一般新生儿体重有无差异?
三、关键区别
1.在已知总体标准差的情况下,使用Z检验;在未知总体标准差的情况下,使用t检验。
2.t检验基于t分布,而Z检验基于正态分布。随着样本量的增加,t分布逐渐接近正态分布。
3.在样本量较小(通常小于30)且总体分布近似正态时,t检验比Z检验更为适用。
4.在样本量较大时,t检验和Z检验的结果通常是非常接近的。
(t检验与Z检验的区别 - 天兰统计-医学统计助手★卡方检验,t检验,F检验,秩和检验,方差分析)
------------------
概念区别:T检验,亦称student t检验(Student's t test),主要用于样本含量较小(例如n<30),总体标准差σ未知的正态分布资料。Z检验是一般用于大样本(即样本容量大于30)平均值差异性检验的方法。它是用标准正态分布的理论来推断差异发生的概率,从而比较两个平均数平均数的差异是否显著。
区别一:z检验适用于变量符合z分布的情况,而t检验适用于变量符合t分布的情况;
区别二:t分布是z分布的小样本分布,即当总体符合z分布时,从总体中抽取的小样本符合t分布,而对于符合t分布的变量,当样本量增大时,变量数据逐渐向z分布趋近;
区别三:z检验和t检验都是均值差异检验方法,但t分布逐渐逼近z分布的特点,t检验的运用要比z检验更广泛,因为大小样本时都可以用t检验,而小样本时z检验不适用。SPSS里面只有t检验,没有z检验的功能模块。
详细:
t检验是用t分布理论来推论差异发生的概率,从而比较两个平均数的差异是否显著。它与f检验、卡方检验并列。t检验是戈斯特为了观测酿酒质量而发明的。
戈斯特在位于都柏林的健力士酿酒厂担任统计学家,基于Claude Guinness聘用从牛津大学和剑桥大学出来的最好的毕业生以将生物化学及统计学应用到健力士工业程序的创新政策。戈斯特于1908年在Biometrika上公布t检验,但因其老板认为其为商业机密而被迫使用笔名(学生)。实际上,跟他合作过的统计学家是知道“学生”的真实身份是戈斯特的。
双总体t检验是检验两个样本平均数与其各自所代表的总体的差异是否显著。双总体t检验又分为两种情况,一是独立样本t检验,一是配对样本t检验。
独立样本t检验统计量为:
S12和 S22为两样本方差;n1 和n2 为两样本容量。
2.配对样本t检验可视为单样本t检验的扩展,不过检验的对象由一群来自常态分配独立样本更改为二群配对样本之观测值之差。
若二群配对样本x1i与x2i之差为di=x1i−x2i独立且来自常态分配,则di之母体期望值μ是否为μ0可利用以下统计量