听,是梯度的声音!用听觉监控神经网络训练,边听音乐边炼丹

本文介绍了一种将神经网络训练过程中的梯度转化为音频的方法,使得训练监督可以通过听觉进行。作者Christian S. Perone创建了一个系统,通过不同层的梯度范数合成声音,以音调变化反映训练状态。通过几个示例,展示了不同学习率和优化器设置对声音的影响,尽管这种方法在极端情况下能明显区分,但在常规调参中可能并不实用,但为枯燥的训练过程增添了一些趣味性。
摘要由CSDN通过智能技术生成

大数据文摘出品

作者:钱天培、魏子敏


训练神经网络是个极为枯燥的工作。与其盯着Learning Curves发呆,或许可以调动一下其他感官,一起做点更有意思的事情。


比如说,眼睛看久了,可以让耳朵也活动活动。


一位酷爱弹吉他的数据科学家就希望,在调参时把其他器官也调动起来共同监督神经网络的训练。


他用一段程序将神经网络训练时的梯度转化成音频,这样,你就可以通过听不同的声音模式知晓训练情况。




先来一段我们制作的小样——梯度的声音!



听出来了嘛?这可是Adam optimizer的弹拨下,梯度发出的声音。



umm没错,确实很难听... 不过先别急着下结论,因为... 更难听的还在后头呢……


把梯度训练变成声音,边听音乐边炼丹


通常,我们需要通过测量许多不同的指标来完成训练,例如准确度、损失、梯度等。多数调参工程师会选择将这些指标整合,并在TensorBoard上绘制可视化图。



而这位名叫Christian S. Perone的数据科学家就厌倦了一直盯着各种参数的传统训练方式,经常玩音乐的他开发了一个小系统,把梯度训练变成声音,并且发布了全部120行代码。



Christian S. Perone也是位吉他手


他用一段程序将神经网络训练时的梯度转化成音频,通过听不同的声音模式就知道训练情况。


这是个讨巧的训练监督方式,毕竟,听觉是目前在神经网络训练中很少被用到的感官。而事实上,人类的听觉感官也非常敏锐,可以非常好地区分非常小的特征,例如节奏和音调,即便是很微小或者短暂的变动,人们也很容易有直观的感受。


先一起来看几个非常简单的训练例子。


以下的几段声音显示了我们使用每层的梯度范数进行的合成声音,以及使用不同设置(如不同学习率、优化器、动量)对MNIST进行卷积神经网络训练的训练步骤等。


因为微信编辑限制,每篇文章只能插入一段音频,我们将后三段声音转化成了视频,请大家点击收听。


使用LR 0.01训练声音与SGD


此段表示,在第一个epoch的前200个step中使用batch size为10的训练结果。我们选取了0.01的learning rate。音高越高,层的范数(norm)就越高,不同批次之前我们插入了短暂的静音。注意渐变在时间内增加。


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值