统计语言模型

最新推荐文章于 2023-10-05 16:16:05 发布

爬行程序猿

最新推荐文章于 2023-10-05 16:16:05 发布

阅读量391

点赞数

分类专栏： NLP自然语言处理文章标签：自然语言处理

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/wang6562009/article/details/122058014

版权

NLP自然语言处理专栏收录该内容

4 篇文章 0 订阅

订阅专栏

统计语言模型

基于概率的判别模型。统计语言模型把语言（词的序列）看作一个随机事件，并赋予相应的概率来描述其属于某种语言集合的可能性。给定一个词汇集合 V，对于一个由 V 中的词构成的序列S = 〈w1, · · · , wT 〉 ∈ Vn，统计语言模型赋予这个序列一个概率P(S)，来衡量S 符合自然语言的语法和语义规则的置信度。用一句简单的话说，统计语言模型就是计算一个句子的概率大小的这种模型。

基本语言模型公式：

P(w1,w2,w3…,wi)=P(w1)P(w2|w1)P(w3|w1,w2)…P(wm|w1,w2,…wi−1)

P为概率，w1为一个句子的各个单词，等式左边为一个句子在训练数据集的概率，等式右边为当前词与前面所有词都有关的概率相乘。

缺点：

1 ：基本语言模型是当前词与前面所有词都有关，但是当句子过于长的时候，就会出现参数过多的问题。

2：因为概率的计算是P(BA)/P(B)，当B过多的时候，会出现数据稀疏问题。因为统计类语言模型是用one—hot编码，维度表示大部分都为0，导致了大量的空间浪费

联合条件概率：P(A,B) = P(A|B)P(B) = P(B|A)P(A)

N-gram语言模型公式：

P(w1，w2，w3，…wi)= P(w1)P(w2|w1)P(w3|w1,w2)…P(wi|wi-1,wi-2),n=3

当前词与前面n-1个词有关，一般情况下n都是取3的。

缺点：

1：没有考虑词与词之间的联系性

2：数据稀疏

以上属于统计型语言模型，像RNN, LSTM, Transformer等属于神经网络型语言模型

爬行程序猿

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。