em算法应用

最新推荐文章于 2022-07-14 19:49:50 发布

summerbell

最新推荐文章于 2022-07-14 19:49:50 发布

阅读量169

点赞数

分类专栏：数据挖掘文章标签：算法 C C++ C# F#

本文链接：https://blog.csdn.net/summerbell/article/details/83439189

版权

9 篇文章 0 订阅

订阅专栏

一

机器翻译中要计算未对齐句对的翻译概率，我们可以采用EM算法获取

P(f|e) =Sigma(P(a, f|e))，一共有如下3种对齐方式

初始化设定 t(x|b)=t(x|c)=t(y|b)=t(y|c)=1/2

对齐1：p(a,f|e)=1/2*1/2=1/4

对齐2：p(a,f|e)=1/2*1/2=1/4

对齐3：p(a,f|e)=1/2

继续计算

对齐1：p(a|e,f)=(1/4)/(1/4+1/4)=1/2

对齐2：p(a|e,f)=(1/4)/(1/4+1/4)=1/2

对齐3：p(a|e,f)=(1/2)/(1/2)=1

tc(x|b)=1/2

tc(x|c)=1/2

tc(y|b)=1+1/2=3/2

tc(y|c)=1/2

完成E步骤，利用E步骤获取的信息重新估计参数

t(x|b)=(1/2)/(1/2+3/2)=1/4

t(x|c)=(1/2)/(1/2+1/2)=1/2

t(y|b)=(3/2)/(1/2+3/2)=3/4

t(y|c)=(1/2)/(1/2+1/2)=1/2

完成M步骤，重复上面的EM步骤，直至收敛

以上只是简单的EM算法的使用，在机器翻译，语言识别等领域应用比较广泛，多用于训练。

二

請按照IBM Model 1及EM algorithm，計算expectation step的c，和maximization step的t，並假設的常數項為1，即。

目前t(e | f) :

Alignments:

Counts:

重新估計後的t(e | f) :

关注