Standford CS231n 循环神经网络简要笔记

最新推荐文章于 2021-05-30 22:39:22 发布

玉兔金兔

最新推荐文章于 2021-05-30 22:39:22 发布

阅读量2.4k

点赞数

分类专栏：机器学习文章标签： RNN LSTM 循环神经网络长短期记忆网络 CS231n

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/wyl1987527/article/details/56682347

版权

机器学习专栏收录该内容

18 篇文章 0 订阅

订阅专栏

循环神经网络笔记（Stanford CS231n）

循环神经网络与卷积神经网络区别：

卷积神经网络需要固定长度的输入和输出，循环神经网络可以是不定长的输入。

卷积神经网络就是下图的一对一实例图，其余几个都是循环神经网络的示意图。

one to many ：输入一个图片，输出一句描述图片的话。

many to one ：输入一句话，判断是正面还是负面情绪。

many to many ：有个延时的，譬如机器翻译。

many to many ：输入一个视频，判断每帧分类。

RNN的计算公式：

在一层RNN中不同时间序列中激励函数和权值参数都一致。

RNN也可以是多层RNN，其网络是整个一模型一起训练的。

RNN存在着梯度爆炸和梯度消散的问题。梯度爆炸可以采用梯度裁剪的方式避免，譬如梯度大于5就强制梯度等于5。梯度消散的问题可以采用LSTM的方式抑制。

LSTM这个网络模型相比于RNN解决了梯度消散问题，同时保留了长时序列的相关性，譬如I am chinese，i speak chinese。最后一个词需要和前一个小分句的最后一个单词相关。

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
Standford CS231n 循环神经网络简要笔记

循环神经网络笔记（Stanford CS231n）循环神经网络与卷积神经网络区别：卷积神经网络需要固定长度的输入和输出，循环神经网络可以是不定长的输入。卷积神经网络就是下图的一对一实例图，其余几个都是循环神经网络的示意图。one to many ：输入一个图片，输出一句描述图片的话。many to one ：输入一句话，判断是正面还
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。