语言模型（language model）

最新推荐文章于 2024-07-05 11:42:45 发布

AI算法工程师YC

最新推荐文章于 2024-07-05 11:42:45 发布

阅读量5.3k

点赞数 5

分类专栏：自然语言处理NLP 文章标签：语言模型 LM

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_36134437/article/details/103126347

版权

本文介绍了统计语言模型的概念，它用于计算句子出现的概率，广泛应用于自然语言处理任务。讨论了建立模型时的自由参数数目和数据稀疏性问题，并通过N-gram模型进行了解决，尤其是Unigram、Bigram和Trigram模型。最后提到了神经网络语言模型如何使用连续表示和softmax来克服这些问题。

摘要由CSDN通过智能技术生成

一、统计语言模型

1、什么是统计语言模型？

统计语言模型是一个单词序列上的概率分布，对于一个给定长度为m的序列，它可以为整个序列产生一个概率 P(w_1,w_2,…,w_m) 。其实就是想办法找到一个概率分布，它可以表示任意一个句子或序列出现的概率。
目前在自然语言处理相关应用非常广泛，如语音识别(speech recognition) , 机器翻译(machine translation), 词性标注(part-of-speech tagging), 句法分析(parsing)等。传统方法主要是基于统计学模型，最近几年基于神经网络的语言模型也越来越成熟。

一个语言模型通常构建为字符串s的概率分布p(s)，这里的p(s)实际上反映的是s作为一个句子出现的概率。

这里的概率指的是组成字符串的这个组合，在训练语料中出现的似然，与句子是否合乎语法无关。假设训练语料来自于人类的语言，那么可以认为这个概率是的是一句话是否是人话的概率。

2、怎么建立统计语言模型？

对于一个由T个词按顺序构成的句子，p(s)实际上求解的是字符串的联合概率，利用贝叶斯公式，链式分解如下：

在这里插入图片描述
从上面可以看到，一个统计语言模型可以表示成，给定前面的的词，求后面一个词出现的条件概率。

我们在求p(s)时实际上就已经建立了一个模型，这里的p(*)就是模型的参数，如果这些参数已经求解得到，那么很容易就能够得到字符串s的概率。

最低0.47元/天解锁文章

AI算法工程师YC

关注

5
点赞
踩
28

收藏

觉得还不错? 一键收藏
0
评论
语言模型（language model）

一、统计语言模型1、什么是统计语言模型？统计语言模型是一个单词序列上的概率分布，对于一个给定长度为m的序列，它可以为整个序列产生一个概率 P(w_1,w_2,…,w_m) 。其实就是想办法找到一个概率分布，它可以表示任意一个句子或序列出现的概率。目前在自然语言处理相关应用非常广泛，如语音识别(speech recognition) , 机器翻译(machine translation), 词...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。