统计学名词解释 —— 1. 什么是「自由度(degree of freedom)」

什么是自由度

数学上,自由度是一个随机向量的维度数,也就是一个向量能被完整描述所需的最少单位向量数。举例来说,从电脑萤幕到厨房的位移能够用三维向量 v ⃗ = a i ⃗ + b j ⃗ + c k ⃗ \vec{v} = a\vec{i} + b \vec{j} + c\vec{k} v =ai +bj +ck 来描述,因此这个位移向量的自由度是3。

在统计学中,自由度(degree of freedom)是指当以样本的统计量来估计总体的参数时,样本中独立或能自由变化的数据的个数,称为该统计量的自由度。一般来说,自由度等于独立变量数减掉其衍生量数;举例来说,方差的定义是样本减平均值(一个由样本决定的衍生量)的平方之和,因此对N个随机样本而言,其自由度为N-1。

上面这两段描述来自维基百科,尽管说的已经很明确,但是我们还是稍微补充一下。假设从总体 S S S 中抽取 N N N 个样本,计算「样本方差」。

S 2 = D ( X ) = 1 n − 1 ∑ i = 1 n ( x i − μ ) 2 S^2 = D(X) = \frac{1}{n-1} \sum_{i=1}^{n} (x_i - \mu)^2 S2=D(X)=n11i=1n(xiμ)2

这里的方差公式与我们平常所用的 1 n ∑ i = 1 n ( x i − μ ) 2 \frac{1}{n} \sum_{i=1}^{n} (x_i - \mu)^2 n1i=1n(xiμ)2 有一些区别。这是为什么呢,假设我们只从总体中抽取1个样本,那么上面这个「样本方差」就无法计算。

对于统计来说,“样本的方差” 一定至少需要两个样本参与计算才能被当作样本与期望的有效离散值。所以我们可以参考数学上对于位移的定义需要三个参数参与

v ⃗ = a i ⃗ + b j ⃗ + c k ⃗ \vec{v} = a\vec{i} + b \vec{j} + c\vec{k} v =ai +bj +ck

而这个移动向量的三个参数即为位移向量的「自由度」。同理,对于「样本方差」最少需要 N − 1 N-1 N1 个样本参与计算,所以它的「自由度」为 N − 1 N-1 N1

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值