双向长短期记忆网络(Bi-LSTM)

本文介绍了循环神经网络(RNN)与递归神经网络的区别,并重点讲解了长短期记忆网络(LSTM)的结构和计算过程,解决了RNN的问题。接着,文章探讨了双向LSTM(Bi-LSTM)的工作机制,它通过正序和逆序输入序列来提升文本特征提取的效率和性能。
摘要由CSDN通过智能技术生成

在开始之前,首先区分下均命名为RNN,新手很容易混淆的两大神经网络:循环神经网络(Recurrent Neural Network,RNN)和递归神经网络(Recurssion Neural Network,RNN)。
递归神经网络(RNN)是空间上的展开,处理的是树状结构的信息,模型结构如下:
在这里插入图片描述

循环神经网络(RNN)是时间上的展开,擅长处理以时间序列数据作为输入的预测问题, 其原因在于 RNN 的网络结构可以处理时间序列数据之间的相关性。模型结构如图所示,包括输入层 x、隐藏层 h、输出层 o,在隐藏层 h 上有一个循环操作,同时 RNN 在所有时刻的线性关系参数 U、 W、 V 都是共享的, 极大地减少了参数训练量.。图 (b) 为 RNN 展开结构图, 可以看到 RNN 通过权值 W 实现隐藏层之间的依赖关系。
在这里插入图片描述

1、长短期记忆神经网络LSTM

长短期神经网络(long short term memory,LSTM)是循环神经网络(RNN)的一种。实际应用中发现RNN 存在诸如梯度消失、梯度爆炸以及长距离依赖信息能力差等问题,因此引入了 LSTM。LSTM 在主体结构上与 RNN 类似,其主要的改进是在隐藏层

双向长短期记忆神经网络Bi-LSTM)是由前向LSTM和后向LSTM组合而成的模型。它的目的是解决传统LSTM模型无法编码从后到前的信息的问题。在句子建模中,Bi-LSTM可以更好地捕捉到双向的语义依赖关系。通过同时考虑前向和后向的上下文信息,Bi-LSTM可以更好地理解句子中词语之间的交互关系,特别是在细粒度的分类任务中,如情感分类。举个例子,对于句子“这个餐厅脏得不行,没有隔壁好”,Bi-LSTM可以更好地捕捉到“不行”对“脏”的程度的修饰。\[2\] Bi-LSTM的运转方式与传统LSTM类似,但在隐藏层中增加了两个方向的门控结构。具体来说,Bi-LSTM包含两个LSTM模块,一个按照正向顺序处理输入序列,另一个按照逆向顺序处理输入序列。每个LSTM模块都有自己的隐藏状态和细胞状态。最后,正向和逆向的隐藏状态会被连接起来,形成最终的双向隐藏状态。这样,Bi-LSTM可以同时利用前向和后向的上下文信息来进行建模和预测。\[3\] #### 引用[.reference_title] - *1* *2* [双向长短期记忆网络BiLSTM)详解](https://blog.csdn.net/qq_45556665/article/details/127685988)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insertT0,239^v3^insert_chatgpt"}} ] [.reference_item] - *3* [双向长短期记忆网络Bi-LSTM)](https://blog.csdn.net/reedci/article/details/117707568)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insertT0,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值