自然语言处理(七)——n元语法模型计算句子出现概率

一、前言

区别于形式语言进行自然语言处理,语言模型在自然语言处理中不关心句子的语法,而是关心这个句子出现的概率,即使一个句子完全符合语法逻辑,但是在语料库中未出现,我们仍然可以认为这个句子出现的概率为0。目前计算句子的概率一般采取n元语法模型,因此接下来就引入n元语法模型

二、n元语法模型

介绍n元语法模型之前,要懂一个理想情况下计算概率的模型。对于一个由m个基元(“基元”可以为字、词或短语等,为了表述方便,以后我们只用“词”来通指,每个基元用w表示)构成的句子s=w_{1}w_{2}w_{3}...w_{m},其概率计算公式可以表示为

p(s) =p(w_{1})p(w_{2} | w_{1})p(w_{3} |

  • 3
    点赞
  • 23
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值