NLP | 自然语言处理 - 语言模型（Language Modeling）

最新推荐文章于 2024-08-01 11:48:17 发布

Allanxl

最新推荐文章于 2024-08-01 11:48:17 发布

阅读量3.5w

点赞数 6

分类专栏：自然语言处理文章标签：自然语言处理 nlp text mining machine learning 算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/lanxu_yy/article/details/29918015

版权

本文介绍了自然语言处理中的语言模型，重点讲解了马尔可夫链，特别是二阶马尔可夫模型。通过定义字典、训练数据集和计算句子概率，阐述了语言模型的基本概念。并详细探讨了二阶马尔可夫模型的计算、度量方法——复杂度（Perplexity），以及如何处理数据稀疏性问题。

摘要由CSDN通过智能技术生成

为什么需要语言模型？

想象“语音识别”这样的场景，机器通过一定的算法将语音转换为文字，显然这个过程是及其容易出错的。例如，用户发音“Recognize Speech”，机器可能会正确地识别文字为“Recognize speech”，但是也可以不小心错误地识别为“Wrench a nice beach"。简单地从词法上进行分析，我们无法得到正确的识别，但是计算机也不懂语法，那么我们应该如果处理这个问题呢？一个简单易行的方法就是用统计学方法（马尔可夫链）从概率上来判断各个识别的正确可能性。

什么是语言模型？

首先，我们定义一个有限的字典V。V = {the, a, man, telescope ... }，通过字典间有限或者无限次笛卡儿积，我们可以得到一个无限的字符串组合S，S可能包含：

1，the

2，a

3，the man

4，the man walks

...

其次，假设我们有一个训练数据集，数据集中包含了许多文章。通过统计数据集中出现的句子、其出现次数c(x)以及数据集句子总数N，我们可以计算出每个句子的出现频率。令x ∈ S，p(x) = c(x)/N表示x的出现频率，显然Σp(x) = 1。

综上所述，我们可以发现几个问题：

1）上述的语言模型只是理论上存在的，当训练数据集无限大的时候，数据集中的频率可以无限接近语法中实际的概率࿱

最低0.47元/天解锁文章

关注

6
点赞
踩
33

收藏

觉得还不错? 一键收藏
4
评论
NLP | 自然语言处理 - 语言模型（Language Modeling）

语音识别”这样的场景，机器通过一定的算法将语音转换为文字，显然这个过程是及其容易出错的。例如，用户发音“Recognition Speech”，机器可能会正确地识别文字为“Recognition speech”，但是也可以不小心错误地识别为“Wrench a nice beach"。简单地从词法上进行分析，我们无法得到正确的识别，但是计算机也不懂语法，那么我们应该如果处理这个问题呢？一个简单易行的方法就是用统计学方法（马尔可夫链）从概率上来判断各个识别的正确可能性。
复制链接

扫一扫

专栏目录

评论 4

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。