【深度之眼cs231n第七期】笔记(二十)

本文介绍了循环神经网络(RNN)的基本结构和应用场景,包括一对一、一对多、多对一、多对多等模式。讲解了RNN的训练策略——截断反向传播,以及在训练结果中的应用。还探讨了RNN的理解,以及在看图说话任务中的模型结构和注意机制。此外,文章详细阐述了LSTM如何解决梯度消失问题,并对比了原始RNN和LSTM的优劣。最后,总结了RNN领域的研究热点。
摘要由CSDN通过智能技术生成

循环神经网络介绍

  • 原始神经网络是一对一的,也就是说只有一个输入(粉红色框),也只有一个输出(蓝色框)。比如输入一张图像,输出图像的类别;
  • 循环神经网络有多种输入输出的组合:
    • 一对多:输入一张图片,输出一句话;
    • 多对一:输入一句话(多个词语),判断这句话的情感;
    • 多对多(输入和输出数量可以不同):输入一句中文,输出一句英文(中英文的词语数量可以不同);
    • 多对多(输入输出数量相同):视频中的每一帧作为输入,输出每一帧的分类结果。
      在这里插入图片描述

循环神经网络的基本结构:ht是保存在绿色框内的状态,某一时刻的输入xt和上一时刻的状态ht-1经过一个函数fW得到当前的状态ht,权重W是函数fW的参数。
注意:权重W和函数fW在整个循环中是不变的。
在这里插入图片描述原始的卷积神经网络公式如下:
状态ht∈[-1,1],通过状态ht计算预测yt在这里插入图片描述
多对多(输入输出个数相同)的计算图:
在这里插入图片描述
多对多(输入输出个数不相同)的计算图(先由多个输入得到一个状态ht,然后通过这个ht产生多个输出):
在这里插入图片描述

例子

训练一个

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值