神经网络如何「动」起来？| 「动态神经网络」的六大待解难题

智源社区

于 2021-08-10 13:44:31 发布

阅读量767

点赞数 2

文章标签：网络神经网络大数据算法 python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/BAAIBeijing/article/details/119583783

版权

【栏目：关键问题】近年来我们不断见证了越来越强大的神经网络模型，如 AlexNet，VGG，GoogleNet，ResNet，DenseNet 以及最近大火的 Transformer 等。

这些神经网络使用的流程，基本可以概括为：1) 固定网络架构，初始化网络参数；2) 训练阶段：在训练集上优化网络参数；3) 推理阶段：固定网络架构与参数，输入测试样本进行前向传播，得到预测结果。

这种范式导致训练完成后，在测试阶段，对所有的输入样本，均采用相同的网络架构与参数进行推理。这在一定程度上限制了模型的表征能力、推理效率和可解释性。

一个非常明显的例子，如下图所示，对于常见的「马」或「猫头鹰」的图片，也许只需要一个小的网络便可以正确识别；然而对于「非经典」的「马」或「猫头鹰」的图片，则需要训练一个大的网络才能正确识别。

再例如，如下图所示，对一张包含「猫」的图片进行识别，我们可以看到，提高分辨率确实可以提高准确率，但同时也伴随着计算量的极速提升。人们自然期望是否可以在不严重影响准确率的情况下，降低输入样本的分辨率，从而来节省计算量。

将这一系列要求「自适应推理」的问题总结起来，便是所谓「动态神经网络」的研究范畴。

与静态网络不同的是，动态网络的本质在于，在处理不同测试样本时，能够动态地调节自身的结构/参数，从而在推理效率、表达能力、自适应性等方面展现出卓越的优势。

撰文：韩益增

编辑：贾伟

内容目录

一、神经网络，如何动起来？

1）样本自适应动态网络

动态结构

动态参数

2）空间自适应动态网络

像素级

区域级

分辨率级

3）时间自适应动态网络

二、六大开放问题

1）结构设计；

2）更多样任务下的适用性；

3）实际效率与理论的差距；

4）鲁棒性；

5）可解释性；

6）动态网络理论。

01

01

神经网络，如何动起来？

最为经典的做法是，以串行或并行的方式，构建多个模型的动态集成，然后根据输入样本自适应地激活其中某个模型。

实际上围绕这一思想，目前已有大量相关研究工作，大致可以分为几种类别，包括「样本自适应动态网络」、「空

最低0.47元/天解锁文章

关注

2
点赞
踩
16

收藏

觉得还不错? 一键收藏
0
评论
神经网络如何「动」起来？| 「动态神经网络」的六大待解难题

【栏目：关键问题】近年来我们不断见证了越来越强大的神经网络模型，如 AlexNet，VGG，GoogleNet，ResNet，DenseNet 以及最近大火的 Transformer 等。...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。