讲讲什么是自由度

总第223篇/张俊红

我们在前面的方差分析中有提过一个概念就是自由度,在前面文章中给了一个计算就是自由度=样本数-1。这一篇就来具体聊聊什么是自由度。

先来看看百度百科的解释:

自由度(degree of freedom, df)指的是计算某一统计量时,取值不受限制的变量个数。通常df=n-k。其中n为样本数量,k为被限制的条件数或变量个数。

上面加粗的部分其实就是关于自由度的核心解释了。再给大家举个例子:

假设现在有三个变量x1、x2、x3,且这三个变量之间没有任何联系,那么这三个变量的取值都是独立的、不受限制的、互不干扰的。这个时候自由度就是3,因为有3个变量的取值不受限制。

如果我们给上面这三个变量加一个限制条件,就是x1+x2+x3=0,这个时候这三个变量的取值就不能随便了,前两个变量的取值可以随便点,但是第三个变量的取值就受前两个变量取值的限制,所以此时的取值不受限制的变量个数变成了2,也就对应的自由度变成了2。

理解了自由度的核心原理以后我们来看看自由度的主要应用场景:

1.方差

第一个场景就是总体方差和样本方差,我们知道总体方差的分母是n,而样本方差的分母是n-1,这是因为在计算样本方差时需要用到样本均值,如果样本均值已知了,那么组成样本的n个样本中就会有一个样本的取值受到限制。此时的自由度就变成了n-1。

再想一下方差的概念,方差其实看的是n个样本的平均波动程度,也就是由这n个样本一起导致的波动有多大。而样本方差中实际能够决定波动的只有n-1个样本,所以就除n-1。

2.回归

在回归方程中也涉及到自由度的问题,假设现在有n个x变量,因为这n个x构成了一个方程,这个方程就是一个约束条件,此时可以自由变换的变量就是n-1个,对应的自由度也就是n-1。

以上就是关于自由度的一个简单介绍,大家好好理解理解。

  • 13
    点赞
  • 38
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

俊红的数据分析之路

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值