一、方差
在概率论和统计方差是衡量随机变量或一组数据时离散程度的度量。概率论中方差用来度量随机变量和其数学期望(即均值)之间的偏离程度。统计中的方差(样本方差)是各个样本数据和平均数之差的 平方和 的平均数。在许多实际问题中,研究方差即偏离程度有着重要意义。
对于一组随机变量或者统计数据,其期望值(平均数)用E(X)表示,即随机变量或统计数据的均值, 然后对各个数据与均值的差的 平方和,如下所示:
最后对平方和再求期望就得到了方差公式,方差的公式如下:
这个公式描述了随机变量(统计数据)与均值的偏离程度。
二、标准差
标准差是方差的平方根,标准差的公式如下:u表示期望
根号里的内容就是我们刚提到的方差
那么问题来了,既然有了方差来描述变量与均值的偏离程度,那又搞出来个标准差干什么呢?
原因是方差与我们要处理的数据的量纲是不一致的,虽然能很好的描述数据与均值的偏离程度,但是处理结果是不符合我们的直观思维的。
举个例子:一个班级里有60个学生,平均成绩是70分,标准差是9,方差是81,假设成绩服从正态分布,那么我们通过方差不能直观的确定班级学生与均值到底偏离了多少分,通过标准差我们就很直观的得到学生成绩分布在[61,79]范围的概率为68%,即约等于下图中的34.2%*2
额外说明:一个标准差约为 68%(平均值-标准差,平均值+标准差), 两个标准差约为95%(平均值-2倍标准差,平均值&#