机器学习系列三 - 延伸方差和样本方差

最新推荐文章于 2022-11-17 15:03:14 发布

hwcj2009

最新推荐文章于 2022-11-17 15:03:14 发布

阅读量424

点赞数

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/hcwj2009/article/details/79976225

版权

机器学习专栏收录该内容

16 篇文章 1 订阅

订阅专栏

课堂上的出来的结论：样本方差的和总体方差是不等的，而是存在一个无偏估计的系数(N-1)/N

先给出概念定义和公式：

设样本均值为，样本方差为，总体均值(期望)为，总体方差为，那么样本方差有如下公式：

样本方差用来表示一列数的变异程度。样本均值又叫样本均数。即为样本的均值。

样本方差的公式为

其中

为样本均值。

如果已知随机变量的期望为，那么可以如下计算总体方差：

这是方差的定义，使用随机一个样本减去均值的平方。

上面的式子需要知道的具体分布是什么（在现实应用中往往不知道准确分布），计算起来也比较复杂。

所以实践中常常采样之后，用下面这个来近似：

下面就是用所有样本减去平均值的平方之后加和再取平均，希望能接近方差。

其实现实中，往往连样本总体的期望也不清楚，只知道样本的均值：

那么可以这么来计算：

那这里就有两个问题了：

为什么可以用来近似？
为什么使用替代之后，分母是？

我们来仔细分析下细节，就可以弄清楚这两个问题。

我们来仔细分析下细节，就可以弄清楚这两个问题。

1 为什么可以用来近似？

举个例子，假设服从这么一个正态分布：

即，，图形如下：

当然，现实中往往并不清楚服从的分布是什么，具体参数又是什么？所以用虚线来表明我们并不是真正知道的分布：

很幸运的，我们知道，因此对采样，并通过：

来估计。某次采样计算出来的：

看起来比要小。采样具有随机性，我们多采样几次，会围绕上下波动：

用作为的一个估计量，算是可以接受的选择。

很容易算出：

因此，根据中心极限定理，的采样均值会服从的正态分布：

这也就是所谓的无偏估计量。从这个分布来看，选择作为估计量确实可以接受。

2 为什么使用替代之后，分母是？

更多的情况，我们不知道是多少的，只能计算出。不同的采样对应不同的：

对于某次采样而言，当时，下式取得最小值：

我们也是比较容易从图像中观察出这一点，只要偏离，该值就会增大：

所以可知：

可推出：

进而推出：

如果用下面这个式子来估计：

那么采样均值会服从一个偏离的正态分布：

可见，此分布倾向于低估。

具体小了多少，我们可以来算下：

其中：

所以我们接着算下去：

————————————————————————————————————————————————————————————————

彻底理解样本方差为何除以n-1

设样本均值为，样本方差为，总体均值为，总体方差为，那么样本方差有如下公式：

很多人可能都会有疑问，为什么要除以n-1，而不是n，但是翻阅资料，发现很多都是交代到，如果除以n，对样本方差的估计不是无偏估计，比总体方差要小，要想是无偏估计就要调小分母，所以除以n-1，那么问题来了，为什么不是除以n-2、n-3等等。所以在这里彻底总结一下，首先交代一下无偏估计。

无偏估计

以例子来说明，假如你想知道一所大学里学生的平均身高是多少，一个大学好几万人，全部统计有点不现实，但是你可以先随机挑选100个人，统计他们的身高，然后计算出他们的平均值，记为。如果你只是把作为整体的身高平均值，误差肯定很大，因为你再随机挑选出100个人，身高平均值很可能就跟刚才计算的不同，为了使得统计结果更加精确，你需要多抽取几次，然后分别计算出他们的平均值，分别记为：然后在把这些平均值，再做平均，记为：，这样的结果肯定比只计算一次更加精确，随着重复抽取的次数增多，这个期望值会越来越接近总体均值，如果满足，这就是一个无偏估计，其中统计的样本均值也是一个随机变量，就是的一个取值。无偏估计的意义是：在多次重复下，它们的平均数接近所估计的参数真值。

介绍无偏估计的意义就是，我们计算的样本方差，希望它是总体方差的一个无偏估计，那么假如我们的样本方差是如下形式：

那么，我们根据无偏估计的定义可得：

由上式可以看出如果除以n，那么样本方差比总体方差的值偏小，那么该怎么修正，使得样本方差式总体方差的无偏估计呢？我们接着上式继续化简：

到这里得到如下式子，看到了什么？该怎修正似乎有点眉目。

如果让我们假设的样本方差乘以，即修正成如下形式，是不是可以得到样本方差是总体方差的无偏估计呢？

则：

因此修正之后的样本方差的期望是总体方差的一个无偏估计，这就是为什么分母为何要除以n-1。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
机器学习系列三 - 延伸方差和样本方差

课堂上的出来的结论：样本方差的和总体方差是不等的，而是存在一个无偏估计的系数(N-1)/N先给出概念定义和公式：设样本均值为，样本方差为，总体均值(期望)为，总体方差为，那么样本方差有如下公式：样本方差用来表示一列数的变异程度。样本均值又叫样本均数。即为样本的均值。样本方差的公式为其中为样本均值。如果已知随机变量的期望为，那么可以如下计算总体方差：这是方差的定义，使用随机一个样本...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。