经过第三步抽取短语后,获得基于短语系统使用的翻译短语对,而接下来的第四步就是短语翻译表概率估计,它的作用是对翻译短语对的正确性进行合理的评估。
在上一节,我们得到了短语对集合,如下图所示:
在这里,我们估计概率主要进行四个分数的计算,即双向短语翻译概率(正向:“源语言->目标语言”方向;反向:“目标语言->源语言”方向 )、双向词汇化权重。首先,在上图上方给定的含有词对齐的句对中,通过上一讲中的短语对抽取算法抽取出14条与词对齐保持一致的短语对,短语概率估计是在图1结果的基础上进行的(在进行概率估计时,短语对集合需要保留词对齐信息)。
1)双向短语翻译概率
“源语言->目标语言”短语翻译概率