目录
Variables are Not Detectable
为什么变量是不能观测到的呢?因为变量可能是 hidden variables,不能被观测,只是一个概念,非真实存在。
HMM
状态变量 y 不能被观测
Gaussian Mixture Model
Missing Values and Data Outliers
缺失值和异常点,系统可能会没有检测到一些观测点。还有一些异常点。
Learning in Gaussian Mixture Models
对一个MLE 框架下,已知数据 D={y[1],…,y[M]}
目标函数:
argmax
θ
p
(
D
∣
θ
)
\underset{\theta}{\operatorname{arg max}} p(D|\theta)
θargmaxp(D∣θ)
对于完整数据,MLE 学习是简单的,已知完整数据 Dc={(x[i], y[i])}i=1…M
E-step:
x的先验分布πk = p(X=k):
π
k
∗
=
M
[
x
=
k
]
M
\pi_k^*=\frac{M[x=k]}{M}
πk∗=MM[x=k]
M-step:
μ
k
∗
=
1
M
[
x
=
k
]
∑
m
y
[
m
]
∣
x
[
m
]
=
k
\mu_k^*=\frac{1}{M[x=k]}\sum_m y[m] |_{x[m]=k}
μk∗=M[x=k]1∑my[m]∣x[m]=k
Σ
k
∗
=
1
M
[
x
=
k
]
∑
m
(
y
[
m
]
−
μ
k
∗
)
(
y
[
m
]
−
μ
k
∗
)
T
∣
x
[
m
]
=
k
\Sigma_k^*=\frac{1}{M[x=k]}\sum_m (y[m]-\mu_k^*)(y[m]-\mu_k^*)^T |_{x[m]=k}
Σk∗=M[x=k]1∑m(y[m]−μk∗)(y[m]−μk∗)T∣x[m]=k
但是实际上X 是不知道的,只有 Y 被观测到。
如果我们知道参数θ,可以求得 X 的后验分布(这是 inference 过程)
Q
(
x
=
k
)
=
P
(
x
=
k
∣
y
,
θ
)
=
p
(
y
∣
x
=
k
,
θ
)
p
(
x
=
k
∣
θ
)
∑
k
=
1
K
p
(
y
∣
x
=
k
,
θ
)
p
(
x
=
k
∣
θ
)
Q(x=k)=P(x=k|y, \theta)=\frac{p(y|x=k, \theta)p(x=k|\theta)}{\sum_{k=1}^{K} p(y|x=k, \theta)p(x=k|\theta)}
Q(x=k)=P(x=k∣y,θ)=∑k=1Kp(y∣x=k,θ)p(x=k∣θ)p(y∣x=k,θ)p(x=k∣θ)
将 x 的先验分布P(X)=π和 Y 的 likelihood P(Y|X=k)=Nk(t)(Y)代入上式, 得到:
Q
(
x
[
m
]
=
k
)
=
π
k
(
t
)
N
k
(
t
)
(
y
[
m
]
)
∑
k
=
1
K
π
k
(
t
)
N
k
(
t
)
(
y
[
m
]
)
Q(x[m]=k)=\frac{\pi_k^{(t)}N_k^{(t)}(y[m])}{\sum_{k=1}{K}\pi_k^{(t)}N_k^{(t)}(y[m])}
Q(x[m]=k)=∑k=1Kπk(t)Nk(t)(y[m])πk(t)Nk(t)(y[m])
其中
N
k
(
y
)
=
1
∣
2
π
Σ
∣
e
x
p
{
−
1
2
(
y
−
μ
k
)
T
Σ
−
1
(
y
−
μ
k
)
}
N_k^{(y)}=\frac{1}{\sqrt{|2\pi \Sigma|}}exp\{-\frac{1}{2}(y-\mu_k)^T\Sigma^{-1}(y-\mu_k)\}
Nk(y)=∣2πΣ∣1exp{−21(y−μk)TΣ−1(y−μk)}
新一轮的 E 步迭代,使用 MLE 更新
计算
Q
(
t
)
(
x
[
m
]
=
k
)
Q^{(t)}(x[m]=k)
Q(t)(x[m]=k), 代入下面式子
π
k
t
+
1
=
1
M
∑
m
=
1
M
Q
(
t
)
(
x
[
m
]
=
k
)
\pi_k^{t+1}=\frac{1}{M}\sum_{m=1}^M Q^{(t)}(x[m]=k)
πkt+1=M1∑m=1MQ(t)(x[m]=k)
新一轮的 M 步迭代: