关于方差、标准差与均方误差

1.是什么?

1.1.方差

概率论中方差用来度量随机变量和其数学期望之间的偏离程度,换而言之,方差的作用是看某一个值和平均值之间相差多少。最终反应的是一组数据内的波动大小,即,方差越大说明波动越大,波动越大表明数据越不稳定、不确定;方差越小说明波动越小,波动越小表明数据越稳定、确定。

假若我们的平均值(期望值)用E(x)表示,全局平均值表示为E(X),则方差就可以笼统地表示为:

D(X) = E\left \{ \sum \left [ x-E(X) \right ]^{2} \right \}

引入某个值的概率(出现的频率),用p(x)表示,则方差就可以笼统地表示为:

D(X)=\sum\left \{ \left [ x-E(X) \right ]^{2}p(x) \right \}

至于为什么说是笼统地,想必聪明的你一定有所察觉,我们这里并没有区分离散型和连续型,所以实际使用的时候还要根据具体情况而定。不过核心思想总是不变的,是一个大差不差的概念。

方差和数学期望之间的数量关系:

D(X)=E(X^{2})-\left [ E(X) \right ]^2

1.2.标准差

标准差又称标准方差,是方差开算数平方根的结果。也可以说,方差是标准差的平方。

用公式直观地表示一下:

\sigma =\sqrt{D(X)}

1.3.均方误差

均方误差是各数据偏离真实值差值的 平方和 的 平均数。

假如当前的真实值为b,则均方误差可以表示为:

MSE(X)=E\left [ \sum (x-b)^2 \right ]

2.区别 ?

2.1.方差与标准差

两者反应的内容都是相同的,换而言之,作用都是一样的。那为什么要多一个标准差呢?

原因在于量纲。(理解量纲为计算单位就可以了)

仔细观察1.1.的两个定义公式,不难发现方差的量纲是随机变量的平方。而我们一般想要的结果是更贴近当前数据的,换而言之,希望得到的是随机变量x等级的结果,而非x^2等级的结果。因此推出标准差是不是很合理了呢?

下面贴一个其他博主(@知乎-千寻)举的我觉得很生动的例子

2.2.方差和均方误差

方差是平均值,均方误差是真实值,换而言之,方差是数据序列与均值的关系,均方误差是数据序列与真实值的关系。

方差一般用来计算样本的离散程度,而均方误差则可以用作衡量模型拟合的一个度量。

3.参考资料

方差、标准差、均方差、均方误差(MSE)区别总结 - 知乎 (zhihu.com)概率论2.4-期望/方差的概念及实际意义 - 知乎 (zhihu.com)方差、标准差、均方差、均方误差(MSE)区别总结 - 知乎 (zhihu.com)

概率论:三、随机变量的期望和方差 - 知乎 (zhihu.com)

  • 7
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Ayu阿予

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值