本文约2300字,建议阅读5分钟
本文通过案例介绍了正态分布和贝塔分布的概念。
正态分布
正态分布,是一种非常常见的连续概率分布,其也叫做常态分布(normal distribution),或者根据其前期的研究贡献者之一高斯的名字来称呼,高斯分布(Gaussian distribution)。正态分布是自然科学与行为科学中的定量现象的一个方便模型。
各种各样的心理学测试结果和物理现象的观测值,比如光子计数等都被发现近似地服从正态分布。甚至生活中很多现象的表征结果也符合正态分布的分布规律。尽管这些现象的根本原因经常是未知的,甚至被采样的样本的原始群体分布并不服从正态分布,但这个变量的采样分布均值仍会近似服从正态分布。
正态分布的概率密度函数呈左右对称的钟形,其具体表达式为:
因为正态分布是如此的常见而这个式子是如此的奇怪,我们打算重温高斯当年的推导过程,但部分细节不会那么严谨的证明,只是带领大家看看高斯当年的思路是如何的。
首先,高斯事先假定了如下条件,才得到了正态分布的连续密度函数。
即: 误差分布导出的极大似然估计 = 算术平均值
这里我们把全部过程用直白的语言复述一遍。
设某物理量真值为 , 而这里我们由于误差等原因,没办法测量得到真值,所以只能对 进行一系列的观测,打算从这些观测值来推断真值。设 为n次独立的观测测量值。站在上帝视角,我们知道每次测量的误差为 ,假设误差 的概率密度函数为 , 如果我们有办法求得 的一般形式,就求得了正态分布(实际上是观测误差的概率分布)的密度分布函数。所以我们的最终目的就是求 的解析表达式。
这些测量值们的联合概率为 个误差的联合概率,记为
我们应该让 取最大值。为求极大似然估计,令
整理后可以得到
别忘了,我们是要从上面的式子想办法求 。令