最大似然估计
设有分布
f(x,θ)
,其中
θ
为未知参数。已知服从该分布的样本
x1,x2,...,xn
,则可以求出当
θ
为何值时,出现
x1,x2,...,xn
这n个样本的概率最大。也就是,在已知实验结果(即样本)的情况下,估计满足这些样本分布的参数,把可能性最大的那个参数
θ
作为真实参数
θ∗
的参数估计。这种参数估计方法称为最大似然估计。
x
与
L(x1,x2,...,xn;θ1,θ2,...,θk)=∏i=1nf(xi;θ1,θ2,...,θk)
称为似然函数,使得似然函数取得最大值的参数 θ ,就是使用最大似然估计求得的真实参数的估计值。
求最大似然函数估计值的一般步骤:
(1)写出似然函数
(2)对似然函数取对数并整理为对数似然
(3)求导数
(4)解似然方程
例1:二项分布的最大似然估计
假定事件出现的概率为
p
(未知参数),进行N次实验,事件出现n次。
(1)似然函数:
(2)对数似然:
hp=ln(pn(1−p)N−n)
(3)求导数:
∂hp∂p=np−N−n1−p
(4)求似然方程
令 ∂hp∂p=0 ,即
np−N−n1−p=0
解得:
p=nN
例2:正态(高斯)分布的最大似然估计
给定一组样本
x1,x2,...,xn
,已知它们服从正态分布
N(μ,σ)
,试估计参数
μ,σ
。
(1)似然函数:
∵
正态分布的概率密度函数为
f(x)=12π−−√σe−(x−μ)22σ2
∴ 似然函数为:
L(x;μ,σ)=∏i=1m12π−−√σe−(x−μ)22σ2
(2)对数似然
l(x)=ln∏i=1m12π−−√σe−(x−μ)22σ2
=∑i=1nln12π−−√σe−(x−μ)22σ2
=∑i=1nln12π−−√σ+∑i=1n−(x−μ)22σ2
=−n2ln(2πσ2)−12σ2∑i=1n(xi−μ)2
(3)求导数,分别对 μ 和 σ 求偏导
对 μ 求偏导:
∂l∂μ=−2∗−12σ2∑i=1n(xi−μ)
令 ∂l∂μ=0 ,解得
μ=1n∑i=1nxi
对 σ2 求偏导:
∂l∂σ2=−n2σ2−−12σ4∑i=1n(xi−μ)2
令 ∂l∂σ2=0 ,解得
σ2=1n∑i=1n(xi−μ)2
称为伪方差。
真实方差:
σ2=1n−1∑i=1n(xi−μ)2