什么是正态分布
关于什么是正态分布,早在中学时老师就讲过了。通俗来讲,就是当我们把数据绘制成频率直方图,所构成曲线的波峰位于中间,两边对称,并且随着往两侧延伸逐渐呈下降趋势,这样的曲线就可以说是符合数学上的正态分布。由于任何特征的频率总和都为100%或1,所以该曲线和横轴之间部分的面积也为100%或1,这是正态分布的几何意义。
如下图,是数据统计实例中出现的正态分布性数据:
为什么要做正态性检验
对此我的理解是,正态性可以保证随机性,因为随机数就是正态分布的,这里可以用高尔顿板来形象化地理解:
高尔顿板为一块竖直放置的板,上面有交错排列的钉子。让小球从板的上端自由下落,当其碰到钉子后会随机向左或向右落下。最终,小球会落至板底端的某一格子中。假设板上共有 n 排钉子,每个小球撞击钉子后向右落下的概率为 ρ(当左、右概率相同时
为 0.5),则小球落入第 k 个格子概率为二项分布