前言
正态分布的导出
python绘制图像
前言
正态分布分布在概率论与数理统计中处于核心地位。它最初作为二项分布计算的渐近公式由棣莫弗引进,后被拉普拉斯发展成系统的理论,但把它作为一个分布来进行研究则归功于高斯,他在19世纪初的测量误差研究中导出的误差函数,后被高斯命名为正态分布。因此正态分布又称高斯分布。这项研究又是当代统计学中重要思想——最大似然估计的源头。
正态分布的导出
在测量中若为 真值,为 观察值,而误差 的分布概率密度为 。经验表明 关于 对称,而且对一切 成立。为了推导方便,还假设 具有连续导函数。
如果有独立同分布的观察值 ,其似然函数为 ,它表征了这组观察值落在 的附近的可能性大小。高斯的假定是:观察值的平均值 作为未知参数 的估值使 达到最大。
下面利用这个假定导出正态分布 若 使似然函数 达到最大,则
记 ,则 ,这时:
当n=2时,方程化为:
由于 ,以及 的任意性得到 对一切实数 成立
当n=3时,方程又可以化为:
由于 ,可知对一切实数 成立
这是柯西函数方程,很容易证明其解比为 .
事实上,若记 ,则方程化为:
这方程对一切 成立,且 是连续函数,因此可令 ,从而得知
因此
, 为密度函数,因此 ,记 ,则有规范化条件 知 ,故
这就是著名的误差函数,它正是正态密度函数。