《自然语言处理宗述》英文版N-gram阅读笔记

最新推荐文章于 2023-05-19 09:29:17 发布

苏何月下追韩信丶

最新推荐文章于 2023-05-19 09:29:17 发布

阅读量459

点赞数

分类专栏： N-gram

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u010995990/article/details/79788920

版权

第四章

N-gram模型：用前面的N-1个词去预测第N个词的概率的模型。并且这种预测第N个词的模型。N指的是句子中的连续N个词。最终显示他与预测一系列词出现的概率相似。

4.2 simple(unsmoothed)N-grams

我们的目标是计算在给定一些内容h,来计算词w出现的概率，即P(w | h).比如计算P(the | its water is so transparent that),

方法一:统计词典中所有句子，计算出ite … that句子后面跟的是the的数目，然后除以总数。

方法二：如下，在h条件的w出现的概率，可以理解为h+w一起出现的概率，然后运用概率论的链式法则，推理如下:

链式法则实现了一个句子的联合概率分布和条件概率分布之间的链接。上式表明了我们可以用一系列的条件概率分布来等价的估计出联合概率分布。颗粒理解为对于单词W，我们并不是一下全部给他所有的h知识，而是一步一步的只给他前一个词。
这里说markov assumption(马尔科夫假设)是一个词出现的概率只依赖与他前面的那个词

最低0.47元/天解锁文章

苏何月下追韩信丶

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
《自然语言处理宗述》英文版N-gram阅读笔记

第四章 N-gram模型：用前面的N-1个词去预测第N个词的概率的模型。并且这种预测第N个词的模型。N指的是句子中的连续N个词。最终显示他与预测一系列词出现的概率相似。 4.2 simple(unsmoothed)N-grams 我们的目标是计算在给定一些内容h,来计算词w出现的概率，即P(w | h).比如计算P(the | its water is...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。