本文简单介绍正态分布
目录
正态分布简介
正态分布(Normal distribution),又名高斯分布(Gaussian distribution),又因其曲线酷似钟形,得名钟形曲线。
还是以上篇提到的测量身高为例,上图正态分布曲线X轴表示人群身高,Y轴表示某个身高对应的概率;
上图绿圈部分,极端矮小或者极端高大的身高都是少数,概率相对低,曲线矮;
上图蓝圈部分,大部分人身高都处于均值身高附近,概率相对大,曲线高。
正态分布关键参数:均值&&标准差
不同正态分布主要区别在曲线的宽度(标准差控制)和曲线中心位置(均值控制);
例,上图为新生儿(左图)和成人(右图)身高的两个正态分布,新生儿身高均值为20英寸,成人身高均值为70英寸。
看图说话:
正态分布总是以均值为中心,从图中大约可见新生儿身高主要分布在19~21英寸,成人身高主要分布在60~80英寸;
新生儿正态分布曲线比成人正态分布曲线高很多,这是因为新生儿身高落在相对高身高的概率比成人更大,粗暴理解为前者只有19~21英寸可选,后者有60~80英寸相对宽的范围可选,可选范围越小,落在某个具体的身高上概率就越高;
正态分布曲线宽度由标准差(Standard Deviation)决定,越大越宽,左图为0.6,右图为4,效果一目了然;
正态分布曲线绘制时,使得95%的测量值落在均值±标准差的范围内,所有左右图红圈分别为20±2x0.6及70±2x4所得,直接回答了正态分布曲线宽度由标准差说了算~~~;
正态分布曲线如何绘制
看图说话:
要绘制一个标准正态分布曲线,第一个关键参数为均值,决定曲线的中心位置;
第二个关键参数为标准差,决定曲线宽度,间接决定曲线高度,曲线越宽越矮,越窄越高。
正态分布曲线现象解释
正态分布曲线在自然界中非常常见,如人的身高、体重、上下班时间等等,对数据统计非常有用,那是什么导致了正态分布的现象了,请看下篇中心极限定理(The central limit theorem).
Reference
个人能力有限,欢迎指出不足,也可以去看原版: