r语言t检验输出检验统计量_两样本t检验原理与R语言实现

t检验也称为student t检验,可以用来比较两个均值的差异是否显著,可分为单总体检验、双总体检验、配对样本检验。

1.1历史

要了解t检验,就不得不提及他的发明者威廉·西利·戈塞特(William Sealy Gosset)。戈塞特先生作为一个拥有化学和数学两个学位的牛津大学新秀,于1899年因化学专长进入爱尔兰都柏林的吉尼斯酿造公司工作。戈塞特先生在公司解决的第一个难题是:如何准确测量一个瓶中酵母细胞的数量。一般情况下,工人会提取瓶中一定量的液体,在显微镜下观察,计量他们所看到的酵母细胞的数量。但酵母会不断的分裂和繁殖,且在瓶中不断运动。因此,我们真正得到的是单位液体中酵母细胞的概率分布。戈塞特先生通过检验数据,发现了酵母细胞的数量可以用泊松分布(Poisson distribution)来描述,且基于泊松分布设计规则和测量方法,能够更加准确地测量酵母细胞的浓度,从而能够生产出更加品质稳定的啤酒。

戈塞特先生想公开发表自己的这一发现。因为泊松分布的公式虽然已经发现了100多年,但已经发现的现实案例却很少。酵母细胞的数量是特塞特发现的一个明确的实例,而且还有具体的应用。这显然是一个非常不错的成果。但吉尼斯酿造公司明确规定不准许雇员公开发表文章。因为曾经有一位酿造师发表文章泄露了公司酿造技术中的某个秘密成份。戈塞特说服自己的老板,允许自己到高尔顿统计实验室在K·皮尔逊先生门下脱产学习一年。在与K·皮尔逊的交流过程中,K·皮尔逊急于将这一成果发表于他负责的期刊《生物统计》上。因此,他们决定用匿名的方式发表文章,“student”从此诞生。此后,这位“student”发表了一系列的重要论文。

戈塞特的所有重要发现中,有一篇论文令几乎所有学科的科学家都获益。那就是1908年发表于《生物统计》上的《The Probable Error of the Meam》。戈塞特先生的良师益友K·皮尔逊先生所有的工作都基于一个重要假设:样本足够大,以至于计算出来的参数几乎不存在误差。但戈塞特先生却常常反问自己:如果样本不足怎么办?如何处理计算中肯定会出现的随机误差?戈塞特先生取出一小组数据,算出平均值和标准差,再将它们相除,然后将结果绘制到图纸上。他发现这个比率值与K·皮尔逊提出的一系列偏斜分布中的某一个分布相配。这一发现的伟大之处在于:你不必知道原始分布的4个参数(K·皮尔逊体系的四个参数分别是平均数、标准差、对称性、峰度)的确切值,前两个参数估计值的比率有一个可以制表的概率分布,不管标准差的真实值是多少,只要计算这两个样本估计值的比率,就可以得到一个已知的分布。这就是t检验的由来。

戈塞特先生关于t检验的一个重要假设前提就是:原始测量值服从正态分布。但随着t检验的大量应用,科学家们越来越相信&#x

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值