N-gram介绍

最新推荐文章于 2022-11-29 22:23:25 发布

VIP文章 guohui_0907

最新推荐文章于 2022-11-29 22:23:25 发布

阅读量2.1k

点赞数

分类专栏：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/guohui_0907/article/details/90382170

版权

1、简介

N-gram是一种基于统计的语言模型，常常用来做句子相似度比较，句子合理性判断。（语言模型就是用来计算一个句子的概率的模型，也就是判断一句话是否合理的概率，RNN是神经语言模型）

N-Gram是基于一个假设：第n个词出现的概率与前n-1个词相关，而与其他任何词不相关。因此整个句子出现的概率就等于各个词出现的概率的乘积。各个词的概率可以通过语料中统计得到。假设句子 $T$ 是有词序列 $w_{1},w_{2},w_{3}...w_{n}$ 组成，用公式表示N-Gram语言模型如下：
$P (T) = P (w 1) p (w 2) p (w 3) p (w n) = p (w 1) p (w 2 ∣ w 1) p (w 3 ∣ w 1 w 2) . . . p (w n ∣ w 1 w 2 w 3 . . .)$

2、N-gram中的数据平滑方法：

当N变大时，更容易出现这样的状况：某些N-gram从未出现过，这就是稀疏问题。

例如，在bi-gram中，若词库中有20k个词，那么两两组合就有近2亿个组合。其中的很多组合在语料库中都没有出现，从而整个句子的概率就会为0。最后的结果是，我们的模型只能计算零星的几个句子的概率，而大部分的句子算得的概率是0，这显然是不合理的。

2.1 +1法

对所有的频率都加1，因此对于unigram而言有：
$P_{add1}(w_{i})=\frac{C(w_{i})+1}{M+|V|}$

最低0.47元/天解锁文章

关注

0
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
N-gram介绍

1、简介N-gram是一种基于统计的语言模型，常常用来做句子相似度比较，句子合理性判断。（语言模型就是用来计算一个句子的概率的模型，也就是判断一句话是否合理的概率，RNN是神经语言模型）N-Gram是基于一个假设：第n个词出现的概率与前n-1个词相关，而与其他任何词不相关。因此整个句子出现的概率就等于各个词出现的概率的乘积。各个词的概率可以通过语料中统计得到。假设句子TTT是有词序列w1,w2...
复制链接

扫一扫

专栏目录

guohui_0907 CSDN认证博客专家 CSDN认证企业博客

码龄9年

38: 原创

44万+: 周排名

171万+: 总排名

3万+: 访问

: 等级

655: 积分

4: 粉丝

15: 获赞

5: 评论

80: 收藏

私信

关注

分类专栏

最新评论

fasttext介绍
爱学习的西西: 博主您好，单词本身<apples>忘记了吧
LSTM为什么可以缓解梯度消失
违规昵称1433223: 偏导数根本不是1你能不能别误导人
LSTM为什么可以缓解梯度消失
ytyds4100: 真的说到点上了，特别是RNN梯度消失的含义与其他网络梯度消失含义的区别，赞赞赞
论文笔记：基于外部知识的会话模型A Knowledge-Grounded Neural Conversation Model
guohui_0907 回复小南瓜^o^: 并没有，原文中我记得是没有公开代码。
论文笔记：基于外部知识的会话模型A Knowledge-Grounded Neural Conversation Model
小南瓜^o^: 博主你好，请问你有没有这篇论文的代码

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。