Language Modeling

本文介绍了语言模型的基本定义、推导步骤,详细讲解了平滑估计方法中的线性插值法和折扣法,并探讨了语言模型在分词和词性标注等NLP任务中的应用。通过最小化困惑度评估模型效果,强调了其在自然语言处理中的核心地位。
摘要由CSDN通过智能技术生成

一,语言模型

1,基本定义

一个语言模型包含一个词汇集合 V V 和一个函数 p ( w 1 , w 2 , . . . , w n ) ,并且该函数满足:

  1. 对于任意的词序列 <w1,w2,...,wn>S,p(w1,w2,...,wn)0 < w 1 , w 2 , . . . , w n >∈ S , p ( w 1 , w 2 , . . . , w n ) ≥ 0 <script type="math/tex" id="MathJax-Element-3"> \in S,p(w_1,w_2,...,w_n)\ge 0</script>,其中 S S 表示基于词汇集合 V 的词序列集合,词序列就是句子。
  2. 此外,
    <w1,w2,...,wn>Sp(w1,w2,...,wn)=1 ∑ < w 1 , w 2 , . . . , w n >∈ S p ( w 1 , w 2 , . . . , w n ) = 1

    因此,
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值