我们用一个简单的数据集和使用简单直观的计算过程来说明如何计算标准差。
数据集:[4, 8, 6, 5, 3]
步骤 1:计算均值
均值是所有数据点的和除以数据点的个数。
-
将所有数据相加:
( 4 + 8 + 6 + 5 + 3 = 26 ) -
数据点的个数是 5。
-
计算均值:
均值 = 总和 ÷ 数据点个数
均值 = 26 ÷ 5 = 5.2
步骤 2:计算每个数据点与均值的差
现在我们计算每个数据点与均值(5.2)的差:
- 对于 4,差 = 4 - 5.2 = -1.2
- 对于 8,差 = 8 - 5.2 = 2.8
- 对于 6,差 = 6 - 5.2 = 0.8
- 对于 5,差 = 5 - 5.2 = -0.2
- 对于 3,差 = 3 - 5.2 = -2.2
步骤 3:计算每个差的平方
现在我们将这些差值平方:
- (-1.2)² = 1.44
- (2.8)² = 7.84
- (0.8)² = 0.64
- (-0.2)² = 0.04
- (-2.2)² = 4.84
步骤 4:计算平方差的平均值
将所有平方后的差值相加,再除以数据点的个数减一(因为我们计算的是样本标准差):
-
平方差的总和:
( 1.44 + 7.84 + 0.64 + 0.04 + 4.84 = 14.80 ) -
数据点个数减一:
5 - 1 = 4 -
平方差的平均值 = 总和 ÷(数据点个数减一)
平方差的平均值 = 14.80 ÷ 4 = 3.70
步骤 5:计算标准差
最后,我们通过取平方根来计算标准差:
标准差 = 平方差的平均值的平方根
标准差 = √3.70 ≈ 1.92