使用无偏估计来计算方差为什么要用N-1

Kawords

于 2024-06-17 17:51:56 发布

阅读量174

点赞数 1

文章标签：概率论机器学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Kawords/article/details/139750577

版权

使用样本均值来代替总体均值会使得方差的估计偏低。

方差的定义是数据点到均值的平方差的平均值。对于一个总体（全体数据），其方差定义为：
\[ \sigma^2 = \frac{1}{N} \sum_{i=1}^N (x_i - \mu)^2 \]
其中 \( \mu \) 是总体均值。

而在样本中，我们并不知道总体均值 \( \mu \)，只能用样本均值 \( \bar{x} \) 来代替：
\[ s^2 = \frac{1}{N} \sum_{i=1}^N (x_i - \bar{x})^2 \]

当我们使用样本均值 \( \bar{x} \) 来代替总体均值 \( \mu \) 时，样本中的数据点和样本均值之间的差异会比与总体均值之间的差异更小。这是因为样本均值本身就是样本数据的平均值，所以它和样本数据之间的距离（差异）较小。这会导致计算出的平方差总和偏小，从而导致方差的估计偏小。

1、样本方差公式（有偏估计）：
\[ s^2 = \frac{1}{N} \sum_{i=1}^N (x_i - \bar{x})^2 \]

2、样本方差公式（无偏估计）：
\[ s^2_{\text{unbiased}} = \frac{1}{N-1} \sum_{i=1}^N (x_i - \bar{x})^2 \]

当使用样本均值 \( \bar{x} \) 计算方差时，实际上得到的是总体方差的一个有偏估计。通过将分母从 \( N \) 改为 \( N-1 \)，可以纠正这个偏差，得到总体方差的无偏估计。

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
使用无偏估计来计算方差为什么要用N-1

当我们使用样本均值 \( \bar{x} \) 来代替总体均值 \( \mu \) 时，样本中的数据点和样本均值之间的差异会比与总体均值之间的差异更小。这是因为样本均值本身就是样本数据的平均值，所以它和样本数据之间的距离（差异）较小。当使用样本均值 \( \bar{x} \) 计算方差时，实际上得到的是总体方差的一个有偏估计。通过将分母从 \( N \) 改为 \( N-1 \)，可以纠正这个偏差，得到总体方差的无偏估计。方差的定义是数据点到均值的平方差的平均值。其中 \( \mu \) 是总体均值。
复制链接

扫一扫

Kawords CSDN认证博客专家 CSDN认证企业博客

码龄5年

19: 原创

9万+: 周排名

7万+: 总排名

4829: 访问

: 等级

275: 积分

31: 粉丝

64: 获赞

1: 评论

32: 收藏

私信

关注

热门文章

分类专栏

python笔记 5篇
踩坑日记 5篇

最新评论

plt.savefig保存的图片为空
CSDN-Ada助手: Python入门技能树或许可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python
vscode调试，launch.json文件传入参数时使用环境变量
CSDN-Ada助手: 非常棒的文章！通过使用环境变量来传入参数，让调试更加灵活和方便。希望你能继续分享更多关于vscode调试的技巧和经验。另外，除了传入参数时使用环境变量，你还可以尝试使用.vscode文件夹中的tasks.json文件来配置任务（tasks）并自动化一些操作，这也是提高开发效率的一种方法。期待你的下一篇文章！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。