EM算法--三硬币模型的Q函数推导

观测数据y_i为看到掷出来的硬币正反,正面为1,反面为0

隐藏数据z_i为A硬币掷出来的正反,正面选择硬币B为1,反面选择硬币C为0

完全数据为(y_i,z_i),因此可得

P(y_i,z_i|\theta )={(\pi p^{y_i} (1-p)^{1-y_i}) }^{z_i}{((1-\pi) q^{y_i} (1-q)^{1-y_i}) }^{1-z_i}

完全数据的对数似然函数为

logP(y_i,z_i|\theta )=\sum_{i=0}^{n}{z_i log{(\pi p^{y_i} (1-p)^{1-y_i}) }+(1-z_i)log{((1-\pi) q^{y_i} (1-q)^{1-y_i}) }}

Q函数为

Q(\theta ,\theta ^{(i)})=E_z[log P(Y,Z|\theta )|Y,\theta ^{(i)}]

                =\sum_{i=0}^{n}{E(z_i )log{(\pi p^{y_i} (1-p)^{1-y_i}) }+(1-E(z_i))log{((1-\pi) q^{y_i} (1-q)^{1-y_i}) }}

其中E(z_i)等于李航大佬《统计学习方法》中公式(9.5),E步到此结束,M求导和迭代,不在赘述

  • 1
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值