机器翻译(待续)

机器翻译 = 语言模型 + 翻译模型

语言模型如:N元语言模型


N元语言模型

举例,三元语言模型,一个词至于它相邻的2个词有关。

条件概率

P(我吃饭)表示词语组合合理的概率。

P(我吃饭)= P(饭|我吃)*P(我吃)

P(我吃)    = P( 吃|我)*P(我)

得到:

P(我吃饭)= P(饭|我吃)*P(吃|我)*p(我); 

基础统计概率这样得到:

[统计词频得到]

P(我)= C(我)/C(X) ;                      

P(吃|我)= C(我X)/ C(我吃)

P(饭|我吃)= C(我吃饭)/ C(我吃X)




在语音识别或者OCR中,如果识别三个字,前两个识别为我吃,

单从第三个字的声音来看,有40%的概率识别为“饭”,有50%的概率识别为“蛋”。

但是P(饭 | 我吃)的概率为50%,P(蛋|我吃)的概率为10%。

综合考虑:

P(我吃饭)= P(饭)* P(饭 | 我吃)=40%*50%

P(我吃蛋)= P(蛋)* P(蛋|我吃)  =50%*10%

所以该字被翻译成饭更合适一些。



  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值