深度学习 loss下降后上升在下降_解读“深度学习最新进展(2020)” Part 5

最新推荐文章于 2024-05-19 15:58:17 发布

weixin_39854681

最新推荐文章于 2024-05-19 15:58:17 发布

阅读量1.1k

点赞数

文章标签：深度学习 loss下降后上升在下降

5. Science of Deep Learning and Interesting Directions

第五部分，介绍的是深度学习理论研究方面的新进展和有趣的方向。

首先是一篇MIT的ICLR 2019 Best Paper《The Lottery Ticket Hypothesis: Finding Sparse, Trainable Neural Networks》。

The Lottery Ticket Hypothesis: Finding Sparse, Trainable Neural Networksarxiv.org

这篇paper告诉我们，面对着强大的神经网络，我们人类还是知之甚少。面对日益臃肿的模型尺寸和参数，MIT的研究人员，用某种方式对网络进行裁剪，发现残留的规模很小的网络仍然能够训练出很好的预测效果。MIT研究人员的研究方法如下，

随机初始化神经网络。这是常规的做法。
训练神经网络直至收敛。
裁剪部分网络。
重新按1的方法随机初始化剩余的网络神经元参数
重新训练裁剪过的网络。观察模型的收敛情况和预测准确率。
以上的过程可以迭代重复。

结果是新的子网络效果一致性地好。研究人员把这个现象命名为“彩票假说”。在庞大的网络结构当中，只有一小部分是产生最终效果的彩票，我们只要抽到它就行了，其它都是无谓的成本。问题是，彩票在哪里呢？

The L

最低0.47元/天解锁文章

weixin_39854681

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
深度学习 loss下降后上升在下降_解读“深度学习最新进展(2020)” Part 5

5. Science of Deep Learning and Interesting Directions第五部分，介绍的是深度学习理论研究方面的新进展和有趣的方向。首先是一篇MIT的ICLR 2019 Best Paper《The Lottery Ticket Hypothesis: Finding Sparse, Trainable Neural Networks》。The Lottery ...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。