1.是什么?
1.1.方差
概率论中方差用来度量随机变量和其数学期望之间的偏离程度,换而言之,方差的作用是看某一个值和平均值之间相差多少。最终反应的是一组数据内的波动大小,即,方差越大说明波动越大,波动越大表明数据越不稳定、不确定;方差越小说明波动越小,波动越小表明数据越稳定、确定。
假若我们的平均值(期望值)用表示,全局平均值表示为
,则方差就可以笼统地表示为:
引入某个值的概率(出现的频率),用表示,则方差就可以笼统地表示为:
至于为什么说是笼统地,想必聪明的你一定有所察觉,我们这里并没有区分离散型和连续型,所以实际使用的时候还要根据具体情况而定。不过核心思想总是不变的,是一个大差不差的概念。
方差和数学期望之间的数量关系:
1.2.标准差
标准差又称标准方差,是方差开算数平方根的结果。也可以说,方差是标准差的平方。
用公式直观地表示一下:
1.3.均方误差
均方误差是各数据偏离真实值差值的 平方和 的 平均数。
假如当前的真实值为b,则均方误差可以表示为:
2.区别 ?
2.1.方差与标准差
两者反应的内容都是相同的,换而言之,作用都是一样的。那为什么要多一个标准差呢?
原因在于量纲。(理解量纲为计算单位就可以了)
仔细观察1.1.的两个定义公式,不难发现方差的量纲是随机变量的平方。而我们一般想要的结果是更贴近当前数据的,换而言之,希望得到的是随机变量等级的结果,而非
等级的结果。因此推出标准差是不是很合理了呢?
下面贴一个其他博主(@知乎-千寻)举的我觉得很生动的例子:
2.2.方差和均方误差
方差是平均值,均方误差是真实值,换而言之,方差是数据序列与均值的关系,均方误差是数据序列与真实值的关系。
方差一般用来计算样本的离散程度,而均方误差则可以用作衡量模型拟合的一个度量。
3.参考资料
方差、标准差、均方差、均方误差(MSE)区别总结 - 知乎 (zhihu.com)概率论2.4-期望/方差的概念及实际意义 - 知乎 (zhihu.com)方差、标准差、均方差、均方误差(MSE)区别总结 - 知乎 (zhihu.com)