python计算标准差为什么分母要-1_为什么样本方差(sample variance)的分母是 n-1?...

很多人其实忘记了样本标准差的目的是干什么用的,我对复杂的数学公式证明不感兴趣(反正书上有),下面我聊下这背后的原因。

首先,方差的开方是标准差,我更喜欢经常用标准差,原因见这里:猴子:有了方差为什么需要标准差?

1.样本标准差为什么除以n-1

当你选择一个样本后,相比总体,你拥有数据的数量是变少了,因此,与总体中的数值偏离平均值的程度相比,样本中很有可能把较为极端的数值排除在外,这样使得数值更有可能以更紧密的方式聚集在均值周围。

也就是说,样本的标准差要小于总体标准差。

所以,为了更好的用样本估计总体的标准差,统计学家就将标准差的公式做了改造:即原来的标准差公式是除以n,为了用样本估计总体标准差,现在是除以n-1。这样就使得标准差略大。弥补了样本的标准差小于总体标准差的不足。

所以很多书上会直接把除以n-1的标准差叫做样本标准,其实这个样本标准差的目的是用于估计总体标准差。

2.你可能会疑惑,那我什么时候标准差除以n还是n-1呢?

其实,这个问题我的一个社群会员@胡小白 也问过这个问题:

只要你记住使用标准差的目的是什么,就不会搞错了。

如果你只是想计算一个数据集的标准差,那么就除以n。例如你有100个毕业与清华人的收入,只是想了解这100个人构成的数据集的波动大小,那你就用除以n的标准差公式。

如果你想用样本来估计总体的标准差,那就用除以n-1的标准差公式。例如你想把刚才例子中这100个人当成一个样本,用这个样本来估计出总体(所有毕业与清华人的收入)的标准差,那么就除以n-1的标准差公式。

3. @问儿 留言提出一个很好的问题:

  • 6
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值