语言模型总结（待完善）

最新推荐文章于 2024-03-23 00:44:17 发布

==樛木==

最新推荐文章于 2024-03-23 00:44:17 发布

阅读量750

点赞数

分类专栏：深度学习之个人总结文章标签：语言模型 n-gram rnn lstm 困惑度

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_38493025/article/details/85600483

版权

本文介绍了统计语言模型的基础概念，包括马尔可夫假设和目标函数，探讨了n-gram、RNNLMs、LSTM以及BiLSTM的优缺点。重点在于理解语言模型如何通过捕捉上下文依赖来预测序列概率，同时分析了困惑度作为评价指标的重要性。

摘要由CSDN通过智能技术生成

1. 基本概念

1.1语言模型的概念

生成文本序列的通常方式是训练模型在给定所有先前词／字符的条件下预测下一个词／字符出现的概率。此类模型叫作统计语言模型.
任意语言模型的主要目的都是学习训练文本中字符／单词序列的联合概率分布，即尝试学习联合概率函数。从而捕捉训练文本的统计结构。

记 $W=w_1^K=(w_1,...,w_K)$ 表示由K个词 $w_1,...,w_K$ 按顺序构成的一个句子。则这个句子的概率为 $P(W)=P(w_1^K)=P(w_1,...,w_K)//联合概率 \\=P(w_1)P(w_2|w_1)P(w_3|w_1,w_2)…P(w_K|w_1,w_2,...,w_{K-1}) \\=P(w_1)P(w_2|w_1^1)P(w_3|w_1^2)...P(w_K|w_1^{K-1})//记为向量形式\\=\prod_{i}P(w_i|w_1^{i-1})$

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。