RNN、LSTM、Seq2Seq模型以及Atttention机制

NayNuhcIem

于 2024-06-28 19:32:49 发布

阅读量1.2k

点赞数 16

文章标签： rnn lstm 人工智能 nlp

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_63047033/article/details/140050346

版权

文章目录

1、生成类聊天机器人特点

在这里插入图片描述

2、RNN LSTM语言模型

2.1 语言模型

自然语言处理（NLP）领域的一个核心技术，它的主要任务是对自然语言序列进行概率建模。 简单来说，语言模型就是用来计算一个句子或者一段文本在某种语言中出现的概率。这个概率可以帮助我们理解和预测自然语言的生成规律，从而在各种NLP任务中发挥关键作用，如机器翻译、语音识别、文本生成等。
在这里插入图片描述

2.2语言模型的计算

在这里插入图片描述

2.3语言模型的应用

语音识别
机器翻译
句法分析
短语标注
手写体识别
拼写纠错

2.4语言模型的方法

基于统计学习的（N——gram）
基于机器学习和深度学习的（机器学习：svm等，深度学习：RNN,LSTM等）

RNN存在的问题：
梯度消息
梯度爆炸

RNN处理序列的类型根据输入和输出的数量，有四种类型。绿色是输入，蓝色是输出，灰色是隐藏层，可捕捉序列前后的信息；并不是每一步都需要输入或者输出，但是隐藏层是不可少的。

同步序列中，Many to many 多对多，输入和输出的数量相同，可用在词性标注，输入一个句子，输出句中每个词的词性；Many to one 多对一，文本的情感分析，输入一句话，输出这句话表达的情绪是积极还是消极。

非同步序列中，Many to many 多对多，可被用作机器翻译，即输入一种语言的文字，输出另外一种语言的文字；One to many，一对多，输入一张图片，输出对于图片内容的描述。
在这里插入图片描述
双向RNN考虑上下文。

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。