稀疏学习：从人脑得到灵感，让深度学习突破算力限制

最新推荐文章于 2023-07-04 11:20:23 发布

VIP文章 BigDataDigest

最新推荐文章于 2023-07-04 11:20:23 发布

阅读量688

点赞数 1

分类专栏：人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/BigDataDigest/article/details/98618108

版权

大数据文摘出品

来源：timdettmers

编译：张秋玥、Luciana、钱天培

深度学习的重要推动力是计算力的进步。

从2010年到2018年，GPU性能提高了97倍。但是，由于我们几乎已达到了半导体技术的物理极限，可以预计，在未来5-8年内GPU性能的提升仅会略高于80％。

在无法进一步提高计算能力的情况下，我们还能进行什么样的研究呢？

一种可行的研究方向是，从人脑中寻找灵感。

人类大脑消耗的能量是GPU的十分之一，但强度要高出10 ^ 9倍。是什么让大脑如此高效？

原因有很多，而其中一个就是是稀疏性。

研究已经发现，灵长类生物大脑中的神经元越多，平均下来每个神经元与其他神经元的连接就越少（来自Herculano-Houzel等人的研究，2010）。这与我们设计深度神经网络的方式恰恰相反。深度神经网络更倾向于将每一层中的每个新神经元都与前一层中的所有神经元连接起来。

我们已经知道如何将一个完全训练好的稠密网络压缩到稀疏网络，但是，让一个网络在训练期间始终保持稀疏却很少被研究。

我们如何才能做到这一点的呢？今天，我们就要介绍ELMo作者Luke Zettlemoyer的最新研究，稀疏动量——一种训练稀疏网络的有效方法。

优秀的稀疏学习算法长什么样？

在稀疏学习中，最重要的是尽可能有效地使用神经网络中的每一个权重。如果将“有效性”定义为“减少误差”，那么我们的下一步就很明确了。我们需要找到能够一个指标——它应当能够衡量一个权重减少误差的效果，并删除所有并不能减少误差的权重。一旦移除了权重，就可以在我们认为有望减少未来误差的位置重新生成新的权重。

如果只是关注关于权重的误差梯度，

最低0.47元/天解锁文章

关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
稀疏学习：从人脑得到灵感，让深度学习突破算力限制

大数据文摘出品来源：timdettmers编译：张秋玥、Luciana、钱天培深度学习的重要推动力是计算力的进步。从2010年到2018年，GPU性能提高了97倍。但是，由于我们几乎已达到了半导体技术的物理极限，可以预计，在未来5-8年内GPU性能的提升仅会略高于80％。在无法进一步提高计算能力的情况下，我们还能进行什么样的研究呢？一种可行的研究方向是，从人脑中寻找灵感。人类大脑消耗的能量是GPU...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。