语言模型和n元语法

最新推荐文章于 2023-09-17 23:12:00 发布

Torero_lch

最新推荐文章于 2023-09-17 23:12:00 发布

阅读量951

点赞数

分类专栏：自然语言处理文章标签： NLP

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Torero_lch/article/details/81626072

版权

语言模型定义

语言模型用来构建字符串s的概率分布，即一个句子出现的概率。考虑句子中词语的联系，其句子出现的概率计算公式可以表示为：

认为第i个词出现的概率是由前面i-1个历史词决定的，这里使用频率来估计概率（这种估计概率值的方法称为极大似然估计，MLE）。在这种情况下，当i较大时，i-1个历史词的组合方式就很多，我们必须考虑所有i-1个历史词的所有组合方式和出现情况。假设词汇集大小1000，i=3,就有10亿种组合情况，导致几乎无法从训练数据集中正确估计出概率。这就是这种语言模型存在的问题，所以引入n元语法。

n元语法

n元语法是指在上述的语言模型中只考虑n-1个历史词的方法。一般n值不能太大，否则也会存在参数（组合情况）过多的问题。当n=1时，称为unigram，即词语i独立于历史；当n=2时，词语i的出现只与前面一个词有关，称为bigram；当n=3时，词语i的出现与前面两个词有关，称为trigram。以二元语法为例（bigram），记为：

最低0.47元/天解锁文章

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
语言模型和n元语法

语言模型定义语言模型用来构建字符串s的概率分布，即一个句子出现的概率。考虑句子中词语的联系，其句子出现的概率计算公式可以表示为：认为第i个词出现的概率是由前面i-1个历史词决定的，这里使用频率来估计概率（这种估计概率值的方法称为极大似然估计，MLE）。在这种情况下，当i较大时，i-1个历史词的组合方式就很多，我们必须考虑所有i-1个历史词的所有组合方式和出现情况。假设词汇集大小1...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。