机器翻译重要过程(4)---估计概率构造短语翻译表

本文介绍了机器翻译中短语翻译表概率估计的过程,包括双向短语翻译概率和双向词汇化权重的计算。通过对大规模双语平行句对的分析,使用极大似然估计来计算短语翻译概率,并通过词汇化加权来平滑稀疏数据,提高短语对的可靠性。
摘要由CSDN通过智能技术生成

        经过第三步抽取短语后,获得基于短语系统使用的翻译短语对,而接下来的第四步就是短语翻译表概率估计,它的作用是对翻译短语对的正确性进行合理的评估。

        在上一节,我们得到了短语对集合,如下图所示:


        在这里,我们估计概率主要进行四个分数的计算,即双向短语翻译概率(正向:“源语言->目标语言”方向;反向:“目标语言->源语言”方向 )、双向词汇化权重。首先,在上图上方给定的含有词对齐的句对中,通过上一讲中的短语对抽取算法抽取出14条与词对齐保持一致的短语对,短语概率估计是在图1结果的基础上进行的(在进行概率估计时,短语对集合需要保留词对齐信息)。


1)双向短语翻译概率

       “源语言->目标语言”短语翻译概率 

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值