最大似然估计是一种用来在给定观察数据下估计所需参数的技术。比如,如果已知人口分布遵从正太分布,但是均值和方差未知, MLE(maximum likelihood estimation)可以利用有限的样本来估计这些参数。
1.正规定义
从分布
f
0
f_0
f0中引出
n
n
n个独立同分布的观察
x
1
,
x
2
,
.
.
.
x
n
x_1,x_2,...x_n
x1,x2,...xn,其中
f
0
f_0
f0是从一族依赖于几个
θ
\theta
θ参数的分布
f
f
f而得来的。
MLE的目标就是最大化似然函数:
L
=
f
(
x
1
,
x
2
,
.
.
.
x
n
∣
θ
)
=
f
(
x
1
∣
θ
)
×
f
(
x
2
∣
θ
)
×
.
.
.
×
f
(
x
n
∣
θ
)
L=f(x_1,x_2,...x_n|\theta)=f(x_1|\theta)\times f(x_2|\theta)\times ...\times f(x_n|\theta)
L=f(x1,x2,...xn∣θ)=f(x1∣θ)×f(x2∣θ)×...×f(xn∣θ)
通常,
l
o
g
log
log似然函数更容易处理:
l
^
=
1
n
l
o
g
L
=
1
n
∑
i
=
1
n
l
o
g
f
(
x
i
∣
θ
)
\hat{l}=\frac{1}{n}logL=\frac{1}{n}\sum_{i=1}^{n}logf(x_i|\theta)
l^=n1logL=n1i=1∑nlogf(xi∣θ)
2.举例
举例一
一个硬币被抛了100次,有61次正面朝上,假设硬币向上的概率猜测有三个
1
3
\frac{1}{3}
31,
1
2
\frac{1}{2}
21,
2
3
\frac{2}{3}
32,以上三个哪个是最大似然估计?
求解:这个是伯努利分布,假设唯一参数为
p
p
p,因此:
P
(
H
=
61
∣
p
=
1
3
)
=
(
100
61
)
(
1
3
)
61
(
1
−
1
3
)
39
≈
9.6
×
1
0
−
9
P
(
H
=
61
∣
p
=
1
2
)
=
(
100
61
)
(
1
3
)
61
(
1
−
1
2
)
39
0.007
P
(
H
=
61
∣
p
=
2
3
)
=
(
100
61
)
(
2
3
)
61
(
1
−
2
3
)
39
≈
0.40
P(H=61|p=\frac{1}{3})=\left(\begin{matrix}100\\61\end{matrix}\right)\left(\frac{1}{3}\right)^{61}\left(1-\frac{1}{3}\right)^{39}\approx9.6\times10^{-9}\\P(H=61|p=\frac{1}{2})=\left(\begin{matrix}100\\61\end{matrix}\right)\left(\frac{1}{3}\right)^{61}\left(1-\frac{1}{2}\right)^{39}0.007\\P(H=61|p=\frac{2}{3})=\left(\begin{matrix}100\\61\end{matrix}\right)\left(\frac{2}{3}\right)^{61}\left(1-\frac{2}{3}\right)^{39}\approx0.40
P(H=61∣p=31)=(10061)(31)61(1−31)39≈9.6×10−9P(H=61∣p=21)=(10061)(31)61(1−21)390.007P(H=61∣p=32)=(10061)(32)61(1−32)39≈0.40
比较以上三个值可以得出
p
=
2
3
p=\frac{2}{3}
p=32是极大似然估计。
举例二
该例子利用导数为0得到极大似然估计,主动计算。