-
最大似然估计要解决的问题,是在已经有一部分采样到的样本的情况下,估计总体的分布
-
首先由一个疑问:最大似然估计为什么要连乘? 也就是定义的形式
L ( θ ) = ∏ i = 1 n p ( x i ; θ ) L(\theta) = \prod_{i=1}^n p(x_i; \theta) L(θ)=i=1∏np(xi;θ)
如果能理解这个定义上的形式,大家就明白了为啥了.
接下来我们开始理解这个公式.首先给出一个图,rgb三种颜色的虚线假设是我们通过采样得到的参数重建的模型,显然,在当前最佳模型估计,也就是红色线模型 p ( x i , θ ) p(x_i, \theta) p(xi,θ),把采样得到的数据带入 p ( x i , θ ) p(x_i, \theta) p(xi,θ)进行连乘,得到的数值是最大的,也就是得到 m a x L ( θ ) max L(\theta) maxL(θ).此时的 θ \theta θ就是模型的最佳估计,最贴近Ground Truth.
而对于绿色线和蓝色线,把采样得到的紫色数据带进去连乘后,得到的
L
(
θ
)
L(\theta)
L(θ)并不是最大的,因此不是最佳估计(这样说略显啰嗦,但更完整).
- 在具体实现的时候,我们当然就不会通过这种假设的方式得到最佳估计,于是就有教科书上取对数变 ∑ \sum ∑,然后求导找极值等等技巧.比如求导之后令等式等于0,这是原函数取得极值的必要条件
参考&致谢
13_最大似然估计【小元老师】考研数学