RNNBow:Visualizing Learining via Backpropagation Gradients in Recurrent Neural Networks （文章解读）

最新推荐文章于 2020-11-29 21:38:49 发布

zhoudapeng01

最新推荐文章于 2020-11-29 21:38:49 发布

阅读量182

点赞数

分类专栏： AI 文章阅读文章标签： RNN 梯度可视化

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zhoudapeng01/article/details/98729359

版权

文章阅读同时被 2 个专栏收录

2 篇文章 0 订阅

订阅专栏

1 篇文章 0 订阅

订阅专栏

https://arxiv.org/pdf/1907.12545.pdf

这篇文章主要强调了RNN中梯度流的重要性。实际上在神经网络模型中梯度有着十分重要的作用，但由于网络结构的复杂性以及参数过于庞大，梯度流的研究一直是一个很困难的问题，所以在一般情况下人们多是通过研究训练好的模型节点的激活情况来研究网络的内部结构以及各参数在网络模型中所起的作用。这篇文章的作者设计了一款网页版的工具，通过这个工具我们可以追踪单层RNN网络的梯度流，从而研究其内部结构以及训练的过程。文章作者强调这个工具可以追踪网络的训练过程，我想这也是和目前常用分析方法最大的区别吧。

文章概要

RNNbow是一个web应用，这个应用可以可视化RNN网络各个节点的输入序列元素的梯度变化。通过可视化梯度而不是激活节点，RNNbow可以深入研究网络是如何学习的。

1、介绍

通过下图我们可以看出RNNbow的一个简单工作模式，真实的字符是“-”，预测的字符是“u”，蓝色高亮的是其损失函数的梯度流，RNN是时间序列，也就是说“-”这个预测结果和之前的5个字符有关。

2、相关工作

目前大多数的工具提供的都是已经训练好的网络的测试效果，而RNNbow提供的是网络的训练过程。这个工具的特点主要体现在：1、可视化梯度流而非激活节点。2、可用于确定超参数是否需要修改。3、与输入数据的类型无关。

3、RNN

循环神经网络，和其他结构相比隐藏层具有长时间记忆能力。输入序列为x1，x2，x3，输出序列为y1，y2，y3，这种结构适合解决上下文关联比较大的问题。

4、RNNbow

图1中显示的是每一个数据簇的最大梯度，图2中显示的是每一个数据簇中的训练结果，图3显示的是每一个点更新参数时的梯度占比，也就是影响前节点的因素。图4中显示的是之前结果对当前结果的影响。

5、应用实例

5.1、观察梯度的变化情况，左边的图可以看出这应该是刚开始训练时的情况，梯度为暗色，主要和附近的输入有关。右边的图可以看出梯度明暗分布，说明模型学习了较长的序列，预测结果和之前较远的结果有关。

5.2、梯度弥散，下图中可以看出后面部分的梯度变暗，其组成部分逐渐变少，说明梯度的构成逐渐变得单一。

5.3、数据簇的最大梯度，以下图为例，真实字符（，预测字符为a，这种情况可能是因为模型并没有训练过这种输入导致的。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
RNNBow:Visualizing Learining via Backpropagation Gradients in Recurrent Neural Networks （文章解读）

https://arxiv.org/pdf/1907.12545.pdf这篇文章主要强调了RNN中梯度流的重要性。实际上在神经网络模型中梯度有着十分重要的作用，但由于网络结构的复杂性以及参数过于庞大，梯度流的研究一直是一个很困难的问题，所以在一般情况下人们多是通过研究训练好的模型节点的激活情况来研究网络的内部结构以及各参数在网络模型中所起的作用。这篇文章的作者设计了一款网页版的工具，通过这个工...
复制链接

扫一扫

专栏目录

zhoudapeng01 CSDN认证博客专家 CSDN认证企业博客

码龄12年

61: 原创

6万+: 周排名

3万+: 总排名

29万+: 访问

: 等级

3162: 积分

275: 粉丝

336: 获赞

152: 评论

1851: 收藏

私信

关注

热门文章

分类专栏

gprMax 4篇
Linux 1篇
VUE 2篇
MNE 15篇
算法 19篇
Pytorch 2篇
MI 1篇
C# 5篇
Java 1篇
神经网络 1篇
Bottle 1篇
软件设计 5篇
matlab 4篇
python 20篇
unity 9篇
word 1篇
jQueryUI 3篇
Combobox 1篇
FileDialog 1篇
AI 1篇
文章阅读 2篇
MySQL 2篇

最新评论

Python中小波工具（pywt）分析EEG数据
三刀一: 节点是否需要重新排列成nature的形式呢，按照这现在的形式直接去重构节点不会出现问题吗。而且对现在的节律信号进行傅里叶变换观察频谱图好像节律信号对应的频段也不对吧
python运行gprMax3.0
qq_58478216: 可以用GPU跑这个代码吗
Python中HHT(希尔伯特-黄变换)以及其在EEG数据处理中的应用
weixin_41542763: 请问你hht spectrum画出来了吗，我也想画这个
C#中实现FFT的两种方法
Iron Brother: 您好请问您有这样的简单示例么，我现在也想实现这个功能但是结果不对，可以请教一下吗
脑电特征中的微分熵（DE）计算
Z.X.L: 非常感谢，没有做过算法，有这个公式简单太多了。

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。