NLP学习之旅——语言模型

第五章 语言模型

本文是对所学内容做总结,链接: 中国科学院大学-自然语言处理-2018

5.1基本概念

n元文法(n-gram)模型

5.2参数估计

5.3数据平滑

(1)加1法(Additive smoothing)
(2)减值法/折扣法(Discounting)
其中减值法主要包括四种方法:Good Turing估计、Back-off(后备后退方法)、绝对法/减值法(Absolute discounting)、线性减值法(linear discounting)
(3)删除法/插值法(deleted interpolation)
虽然相对于绝对减值法,线性减值法在解释上更为合理,但是实际效果却是绝对减值法更好。
最简单粗暴的方法,效果反而更好。目前使用最多的一般都是两种方法:加1法和绝对减值法。
各种平滑已经研究的很透彻了,其中各种平滑法的详细介绍及比较链接如下:
链接: Postdoctoral Fellow, Center for Automated Learning and DiscoveryCarnegie Mellon University.
且因为研究透彻,出现了一些工具:

  1. SRI 语言模型工具.
  2. CMU-Cambridge 语言模型工具.

5.4语言模型的自适应

(1) 基于型 缓存的语言模型 (Cache-based LM)
(2) 基于混合方法的语言模型
(3)基于最大熵的语言模型

5.5语言模型应用举例

词类表
模型训练三步

本文是对内容进行大致提取,更多细节部分可以参考PPT。PPT链接: 自然语言理解课程讲义.

  • 2
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值