从0开始学统计-t分布

1.t分布是如何被发现的?

t分布最早由英国统计学家威廉·塞弗顿(William Sealy Gosset)在1908年提出。塞弗顿是爱尔兰的一名酿酒厂的统计学家,他的工作需要对小样本数据进行分析。由于当时样本量较小(通常小于30),传统的正态分布方法不适用于估计样本均值的抽样分布。

塞弗顿在研究中发现,当样本量较小时,样本均值的抽样分布不再服从正态分布,而是更广的、更平坦的分布。他进行了大量的模拟实验,并提出了一种新的分布,即t分布,以解决小样本量下的统计问题。

塞弗顿的研究成果最终在1908年发表在《生物学期刊》上,但由于他在酿酒厂工作,为了保密,他使用了笔名“学生”(Student)。因此,t分布也被称为学生t分布。

塞弗顿的工作对统计学产生了重大影响,尤其是在小样本数据的分析和参数估计方面。至今,t分布仍然被广泛应用于统计学和数据分析领域。

样本量大的时候,样本平均数的分布可以转化为标准正态分布:

在这里插入图片描述
但是当样本量较小的时候,这个比值的分布不再是标准正态分布。也就是说当样本量较小的时候,不能将正态分布转化为标准正态分布。因为小样本的标准差与总体的标准差存在差别,不能直接用小样本的标准差代替总体的标准差。

塞弗顿将小样本时的比值称为t值,服从新的正态分布,即t分布。t分布的均值还是0,但是标准差不再是1了。

在这里插入图片描述
2.什么是t分布的自由度?

在t分布中,自由度(degrees of freedom,简称df)是一个参数,用来确定t分布的形状。具体来说,自由度决定了t分布的尾部的厚度和宽度。

在t分布的概率密度函数中,自由度是一个正整数,通常表示为 ν。自由度越大,t分布的形状就越接近于标准正态分布(图中绿色线为标准正态分布),尾部就越窄;自由度越小,t分布的尾部就越厚,形状更加扁平。

在这里插入图片描述
在统计学中,自由度通常与样本量有关,但并不等于样本量。在不同的统计问题中,自由度的计算方式略有不同,但它们都与样本量和统计模型的复杂度有关。

3.t分布的界值是多少?

不同的自由度下,t分布有不同的界值,可以通过查表或者软件得到具体的界值。

在这里插入图片描述
比如双侧0.05,n=8时的界值在t分布和z分布时分别是:

在这里插入图片描述
我们上次做的估算总体降压效果的置信区间如果用t分布算,会得到一个更加准确的置信区间。

在这里插入图片描述
这里样本平均值是18mmHg,标准误是1.907。

在这里插入图片描述
因此,总体均值95%置信区间在13.496和22.504之间。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

花花 Show Python

你的打赏会让我有创作的动力!

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值