概率图学习——Learning with incomplete data 从部分观测数据学习

Variables are Not Detectable

为什么变量是不能观测到的呢?因为变量可能是 hidden variables,不能被观测,只是一个概念,非真实存在。

HMM

在这里插入图片描述
状态变量 y 不能被观测

Gaussian Mixture Model

在这里插入图片描述

Missing Values and Data Outliers

缺失值和异常点,系统可能会没有检测到一些观测点。还有一些异常点。

Learning in Gaussian Mixture Models

对一个MLE 框架下,已知数据 D={y[1],…,y[M]}
目标函数: argmax ⁡ θ p ( D ∣ θ ) \underset{\theta}{\operatorname{arg max}} p(D|\theta) θargmaxp(Dθ)
在这里插入图片描述
对于完整数据,MLE 学习是简单的,已知完整数据 Dc={(x[i], y[i])}i=1…M
在这里插入图片描述
E-step:
x的先验分布πk = p(X=k): π k ∗ = M [ x = k ] M \pi_k^*=\frac{M[x=k]}{M} πk=MM[x=k]
M-step:
μ k ∗ = 1 M [ x = k ] ∑ m y [ m ] ∣ x [ m ] = k \mu_k^*=\frac{1}{M[x=k]}\sum_m y[m] |_{x[m]=k} μk=M[x=k]1my[m]x[m]=k
Σ k ∗ = 1 M [ x = k ] ∑ m ( y [ m ] − μ k ∗ ) ( y [ m ] − μ k ∗ ) T ∣ x [ m ] = k \Sigma_k^*=\frac{1}{M[x=k]}\sum_m (y[m]-\mu_k^*)(y[m]-\mu_k^*)^T |_{x[m]=k} Σk=M[x=k]1m(y[m]μk)(y[m]μk)Tx[m]=k

但是实际上X 是不知道的,只有 Y 被观测到。
如果我们知道参数θ,可以求得 X 的后验分布(这是 inference 过程)
Q ( x = k ) = P ( x = k ∣ y , θ ) = p ( y ∣ x = k , θ ) p ( x = k ∣ θ ) ∑ k = 1 K p ( y ∣ x = k , θ ) p ( x = k ∣ θ ) Q(x=k)=P(x=k|y, \theta)=\frac{p(y|x=k, \theta)p(x=k|\theta)}{\sum_{k=1}^{K} p(y|x=k, \theta)p(x=k|\theta)} Q(x=k)=P(x=ky,θ)=k=1Kp(yx=k,θ)p(x=kθ)p(yx=k,θ)p(x=kθ)
将 x 的先验分布P(X)=π和 Y 的 likelihood P(Y|X=k)=Nk(t)(Y)代入上式, 得到:
Q ( x [ m ] = k ) = π k ( t ) N k ( t ) ( y [ m ] ) ∑ k = 1 K π k ( t ) N k ( t ) ( y [ m ] ) Q(x[m]=k)=\frac{\pi_k^{(t)}N_k^{(t)}(y[m])}{\sum_{k=1}{K}\pi_k^{(t)}N_k^{(t)}(y[m])} Q(x[m]=k)=k=1Kπk(t)Nk(t)(y[m])πk(t)Nk(t)(y[m])
其中 N k ( y ) = 1 ∣ 2 π Σ ∣ e x p { − 1 2 ( y − μ k ) T Σ − 1 ( y − μ k ) } N_k^{(y)}=\frac{1}{\sqrt{|2\pi \Sigma|}}exp\{-\frac{1}{2}(y-\mu_k)^T\Sigma^{-1}(y-\mu_k)\} Nk(y)=2πΣ 1exp{21(yμk)TΣ1(yμk)}
新一轮的 E 步迭代,使用 MLE 更新
计算 Q ( t ) ( x [ m ] = k ) Q^{(t)}(x[m]=k) Q(t)(x[m]=k), 代入下面式子
π k t + 1 = 1 M ∑ m = 1 M Q ( t ) ( x [ m ] = k ) \pi_k^{t+1}=\frac{1}{M}\sum_{m=1}^M Q^{(t)}(x[m]=k) πkt+1=M1m=1MQ(t)(x[m]=k)
新一轮的 M 步迭代:
在这里插入图片描述

General Principles and Methods

General Priciples
Expectation Maximization(EM)
MCMC Sampling
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值