【概率论与数理统计】如何理解自由度n?

统计学上常常说的自由度是到底是什么?
在样本方差计算中,分母不是样本数量,而是样本量减一,人们一般认为减一是因为缺少一个自由度的原因,那么这个自由度的概念到底是什么?

解答

自由度不容易解释,他们在统计中的一些先进和复杂的许多不同的情况下出现。 在数学方面,他们在技术上定义为一个随机向量域的维数。

但我们不会讲到这些,因为自由度通常不是你需要了解执行统计分析,除非你是一个研究的统计学家或有人研究统计理论。然而心中真想知道,为了冒险和好奇,下面是一些例子,提供一个统计数据的基本要点。

不同的自由度

首先忘记统计数据,想象你是一个风趣的人,喜欢戴帽子,你不关心什么是自由度,你相信多样性是生活的调味品。不幸的是你有约束,你只有7个帽子。然而,你想每天戴不同的帽子。

在第一天,你可以戴7帽子中的任何一个。第二天,你可以从剩下的6个帽子中选择,第三天你可以从剩下的5个帽子中选择,等等。

第六天,在这周没有戴过的帽子中你还有2个帽子选择。但你选择你的帽子后6天,在7天你没有可以选择的帽子戴。你必须戴最后剩下的帽子。你有7 - 1 = 6天的“帽子”自由的帽子你可以改变!

这是统计中的自由度的一种理念。自由度通常被广泛地定义为“观测”(信息的片段)在估计统计参数时自由变化的数据的数量。

自由度:单样本t检验
现在想象你没有帽子,你进入数据分析。

你有一个10个值的数据集,如果你不估计,每个值可以取任意数量,对吗? 每个值是完全自由的变化。

但如果你想用单样本t检验测试一个10样本总体均值,你现在有一个约束的均值估计。这个约束到底是什么? 根据定义的意思,下面的关系必须保持:数据中所有值的总和必须等于nx的平均值,n为数据集的数量值。

如果一个数据集有10个值,10个值的总和必须等于平均值x 10。如果10个值的均值为3.5(你可以选择任意数量),这种约束要求10个值之和必须等于10 x 3.5 = 35。有了这个约束,数据集的第一个值是可以自由变化的。对于任何值,所有10个数字值和对于35仍然是可能。 第二个值还可以自由变化因为无论你选择何种值,它仍然允许的可能性的总和为35。

事实上,前9个值可以是任何东西,包括这2个例子:

34, -8.3, -37, -92, -1, 0, 1, -22, 99
0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9

但要有所有10个值的总和为35,并有一个平均值为3.5,第十个值不能改变。它必须是一个特定的数字:

34, -8.3, -37, -92, -1, 0, 1, -22, 99 -----> 10TH value must be 61.3
0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9 ----> 10TH value must be 30.5

因此你有10 - 1 = 9自由度,不管您使用什么样本量或者是你在使用样本平均值的最后一个值是不自由变化,你最终得到n- 1自由度其中n是样本容量。

另一种方式是,自由度的数量等于“观测”的数量减去所需的观测之间的关系(例如,参数估计数)。对于单样本t检验一个自由度估计均值,剩下的n- 1自由度估计可变性。自由度定义特定的t分布,用来计算t检验p值和t值。
在这里插入图片描述

注意,对于小样本(n),有较小的自由度(n - 1对应的单样本t检验),t分布有胖的尾巴。这是因为t分布是专门设计提供更多保守的测试结果在分析小样本(如在酿酒行业)。 随着样本容量(n)的增加,自由度数量增加,t分布接近正态分布。

原文链接:统计学上常常说的自由度是到底是什么?

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值