RNN及其变体

RNN及其变体
    RNN模型定义
        循环神经网络:一般接受的一序列进行输入,输出也是一个序列
        作用和应用场景:
RNN擅长处理连续语言文本,机器翻译,文本生成,文本分类,摘要生成
        RNN模型的分类
根据输入与输出结构
N Vs N  : 输入和输出等长,应用场景:对联生成;词性标注;NER
N Vs 1   : 输入N,输出为单值,应用场景:文本分类
1 Vs  N  : 输出是一个,输出为N,应用场景: 图片文本生成
N Vs M  : 输入和输出不等长,应用场景: 文本翻译,摘要总结
        根据RNN内部结构
传统RNN
LSTM
BI-LSTM
GRU
BI-GRU
            传统RNN模型
内部结构
       输入:当前时间步xt和上一时间步输出的ht - 1
       输出:ht和ot(一个时间步内: ht = ot)
    LSTM模型
        内部结构
遗忘门
输入门
细胞状态
输出门
        BI-LSTM模型
            
        BI_LSTM定义:
不改变原始的lSTM模型内部结构,只是将文本从左到右计算一遍,再从右到左计算一遍,把最终的输出结果拼接得到模型的完整输出

LSTM模型
    内部结构
遗忘门
输入门
细胞状态
输出门
    BI-LSTM模型
        
    BI_LSTM定义:
不改变原始的lSTM模型内部结构,只是将文本从左到右计算一遍,再从右到左计算一遍,把最终的输出结果拼接得到模型的完整输出

  • 18
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
LSTM是一种循环神经网络(RNN)的变体,广泛应用于序列数据处理任务中。根据引用中提供的信息,以下是几种常见的LSTM及其变体的性能对比: 1. BasicLSTMCell:这是最基本的LSTM单元,由标准的LSTM结构组成。它具有较低的计算复杂度和内存消耗,适用于大多数任务。 2. static_rnn:这是一个静态循环网络,它使用BasicLSTMCell构建。静态循环网络适用于序列长度固定的情况,但对于变长序列需要进行填充处理。 3. dynamic_rnn:这是一个动态循环网络,也使用BasicLSTMCell构建。相比静态循环网络,动态循环网络能够处理变长序列,不需要进行填充处理。 4. LSTMBlockCell和LSTMBlockFusedCell:这两个变体是为了提高性能而设计的。LSTMBlockCell使用基于计算图的操作,而LSTMBlockFusedCell使用基于计算图的操作和GPU加速。它们在计算速度和内存效率方面相对较高,适用于大规模数据集和复杂任务。 5. contrib.cudnn_rnn:这是TensorFlow的一个贡献库,提供了与NVIDIA的cuDNN库集成的高性能LSTM实现。该实现能够利用GPU进行加速,适用于需要大规模并行计算的任务。 根据引用中提供的信息,理解LSTM的基本结构对于理解其变体的结构是非常重要的。一旦掌握了基本结构,理解和应用不同的变体就会相对容易。 另外,引用提到了双向LSTM,它由一个正向的LSTM和一个逆序的LSTM组成。双向LSTM能够同时利用过去时刻和未来时刻的信息,因此在预测任务上通常比单向LSTM更准确。 综上所述,现有的LSTM及其变体在性能方面有所区别。选择适合特定任务和数据集的LSTM变体需要考虑计算资源、数据特征和性能要求等因素。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* [TensorFlow 学习笔记 - 几种 LSTM 对比](https://blog.csdn.net/myonelotus/article/details/80199373)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] - *2* *3* [长短期记忆网络(Long Short-Term Memory,LSTM)及其变体双向LSTM和GRU](https://blog.csdn.net/weixin_42111770/article/details/80900575)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值