【全面了解自然语言处理三大特征提取器】RNN（LSTM）、transformer（注意力机制）、CNN

置顶

D_klein

已于 2025-03-06 21:22:36 修改

阅读量4.9k

点赞数 35

文章标签： rnn 自然语言处理 lstm

于 2024-03-17 19:11:59 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_45929355/article/details/136616516

版权

本文介绍了RNN、LSTM和Transformer在自然语言处理中的应用，探讨了它们的基本结构、工作原理、优点与缺点，重点强调了LSTM如何解决RNN的梯度问题，以及Transformer的并行性和长距离依赖处理能力。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

目录

一、RNN
二、LSTM
- 1.LSTM单个cell的结构
- 2. LSTM工作原理
三、transformer
- 1 Encoder

自然语言处理（NLP）是人工智能领域中一个重要的分支，它的目的是让计算机能够理解和处理人类语言，而特征提取是让计算机理解和处理人类语言时必不可少的过程，除了数据的因素，一个特征抽取器是否适配问题领域的特点，有时候决定了它的成败，而很多模型改进的方向，其实就是改造得使得它更匹配领域问题的特性（引自张俊林老师的文章）。
下面本文从基本结构、工作原理、优缺点和适用场景具体介绍一下这三个主要的特征提取器

一、RNN

循环神经网络或递归神经网络。顾名思义，RNN在处理序列信息时（比如一段文本）是递归进行，即下一时刻的处理依赖于上一时刻的结果。
即：不同于传统的神经网络结构，RNN隐藏层之间的节点不再无连接而是有连接的。

1.RNN单个cell的结构

参考

在这里插入图片描述
可以看到当前时刻的输出 y^t 和隐藏层状态 a^t 依赖于当前时刻的输入 x^t 和上一时刻的隐藏层状态 a^t-1

2.RNN工作原理

在这里插入图片描述

其中一个cell对应于RNN单个细胞的结构，对于上图中的文本翻译问题，输出接收最后一层每个时刻隐藏层的状态，但是对于分类问题，输出只接受最后一层最后一个时刻的隐藏层状态。

3.RNN优缺点

优点：
1. RNN能够有效地处理序列数据
2. 由于权重共享，RNN在内存使用上比全连接网络高效
缺点
1. 梯度消失和梯度爆炸：在学习长序列时，RNN容易遇到梯度消失或梯度爆

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。