EM算法的推广
一、F函数的极大极大算法
F函数:假设隐变量Z的概率分布为
P˜(Z)
P
~
(
Z
)
,定义分布
P˜
P
~
与参数
θ
θ
的函数如下:
F(P˜,θ)=EP˜[logP(Y,Z|θ)]+H(P˜)
F
(
P
~
,
θ
)
=
E
P
~
[
log
P
(
Y
,
Z
|
θ
)
]
+
H
(
P
~
)
式中
H(P˜)=−EP˜logP˜(Z)
H
(
P
~
)
=
−
E
P
~
log
P
~
(
Z
)
是Z的概率分布的熵。
关于F函数的性质:
引理9.1:对于固定的
θ
θ
,存在唯一的分布
P˜θ
P
~
θ
极大化
F(P˜,θ)
F
(
P
~
,
θ
)
,其定义如下:
P˜θ(Z)=P(Z|Y,θ)
P
~
θ
(
Z
)
=
P
(
Z
|
Y
,
θ
)
其值随参数变化而变化。
引理9.2:若
P˜θ(Z)=P(Z|Y,θ)
P
~
θ
(
Z
)
=
P
(
Z
|
Y
,
θ
)
,则有:
F(P˜,θ)=logP(Y|θ)
F
(
P
~
,
θ
)
=
log
P
(
Y
|
θ
)
二、GEM算法
关于GEM算法,因书本中只是列出了算法,所以可以看《统计学习方法》第168页,这里不进行叙述