我们知道了方差是用来评价一组数据的离散程度,然而他与原数据 不处在同一个级数下,往往很难理解数据的离散程度,这个时候就需要引入 标准偏差 和变异系数,让这个指标 归一化,能更简单的去评价数据的离散程度。
标准偏差(Standard Deviation)
定义
标准差(又称标准偏差、均方差,英语:Standard Deviation,缩写SD),为方差开算术平方根,反映组内个体间的离散程度。1
标 准 偏 差 2 标准偏差^2 标准偏差2 = 方差
方
差
:
σ
2
=
1
n
∑
i
=
1
n
(
x
i
−
x
ˉ
)
2
.
方差: \sigma^2= \frac{1}{n}\displaystyle\sum_{i=1}^n(x_i-\bar x)^2\,.
方差:σ2=n1i=1∑n(xi−xˉ)2.
标
准
偏
差
:
S
D
(
σ
)
=
1
n
∑
i
=
1
n
(
x
i
−
x
ˉ
)
2
.
标准偏差:SD(\sigma)= \sqrt{\frac{1}{n}\displaystyle\sum_{i=1}^n(x_i-\bar x)^2\,}.
标准偏差:SD(σ)=n1i=1∑n(xi−xˉ)2.
根号里的式子其实就是方差的计算式, x ˉ \bar x xˉ 是数据的平均值
如何理解
统计学在68-95-99法则里经常会用到标准偏差。
可以理解为分别有68%,95%,99.7%的几率在平均值±1标准偏差μ ± 1σ,μ ± 2σ,μ ± 3σ的范围内发生概率事件。
- 如果一组数据服从正态分布,标准偏差能简单的表示这组数据出现某个范围的发生概率。
名字的由来
标准偏差的名字首先是,
- 数据和平均值的差表示为 偏差,由于偏差的和有可能 ≤ \le ≤ 0 ,为了让偏差来代表整组数据的离散程度,且不会出现小于0的值。
- 用偏差平方并取平均值,也就是 方差
- 把平方去掉,让这个指标归一化(标准),也就的来了标准偏差。
小结
- 方差和标准偏差都代表了数据的离散程度
- 方差:(各数据和平均的差)的平方的均值
- 标准偏差:方差的平方根
- 标准偏差和原始数据在 同一级数下,所以更方便使用和评价。
本作品采用知识共享署名-非商业性使用-相同方式共享 4.0 国际许可协议进行许可。