【一起入门NLP】中科院自然语言处理第7课-语言模型-神经语言模型（NNLM+RNNLM）

最新推荐文章于 2025-01-08 11:00:56 发布

原创最新推荐文章于 2025-01-08 11:00:56 发布 · 1.6k 阅读

·

3

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#自然语言处理 #神经语言模型

自然语言处理专栏收录该内容

26 篇文章

订阅专栏

本文介绍了神经语言模型的基础，包括DNN语言模型（NNLM）和RNN语言模型（RNNLM）。NNLM利用词向量对词进行表示，而RNNLM通过循环神经网络捕捉上下文信息，能更有效地处理长距离依赖。RNNLM相比n-gram模型能保留完整的历史信息，且不需要数据平滑。文章还提及了RNN的多种变形，如正向、反向和双向语言模型。

专栏介绍：本栏目为 “2021秋季中国科学院大学胡玥老师的自然语言处理” 课程记录，不仅仅是课程笔记噢～如果感兴趣的话，就和我一起入门NLP吧🥰

目录

1. 神经语言模型概述
2. DNN语言模型（NNLM）
3. RNN语言模型（RNNLM）
4. RNN语言模型变形

1. 神经语言模型概述

对于语言模型参数P（Wi | W1W2…Wi-1）

统计语言模型：用概率统计法学习参数（在上一篇博客中我们做过一个似然估计法的例题）
神经语言模型：用神经网络学习参数
使用DNN 学习模型参数：NNLM 模型
使用RNN 学习模型参数： RNNLM 模型

2. DNN语言模型（NNLM）

我们以2-gram为例（只考虑当前词的前一个词）。

模型结构：
在这里插入图片描述
输入前一个词（如果是n-gram对应输入前n-1个词），输出是后一个词的概率。那么有一个新的问题是，词以什么样的形式输入到神经网络中呢？这里就引出了词向量的概念，我们将在下一篇博客中谈到。

3. RNN语言模型（RNNLM）

我们以2-gram为例（只考虑当前词的前一个词）。

模型结构：
在这里插入图片描述

随着模型逐个读入语料中的词w1;w2 ….隐藏层不断地更新为h(1),h(2)…… ,通过这种迭代推进方式，每个隐藏层实际上包含了此前所有上文的信息，相比NNLM 只能采用上文n 元短语作为近似，RNNLM 包含了更丰富的上文信息，也有潜力达到更好的效果。

RNNLM 优点：

RNNLM 模型可以保留每个词的全部历史信息，不需简化为n-gram
引入词向量作为输入后不需要数据平滑
神经网络一般用RNN语言模型

4. RNN语言模型变形

正向语言模型
反向语言模型
双向语言模型
单向多层RNN语言模型
双向多层RNN语言模型

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

小测晓测 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。