Dynamic Network Surgery for Efficient DNNs 核心思想解析

最新推荐文章于 2022-02-10 18:53:21 发布

Gallant Hu

最新推荐文章于 2022-02-10 18:53:21 发布

阅读量464

点赞数 1

分类专栏：目标检测从基础到实践--系列论文讲解

本文链接：https://blog.csdn.net/weixin_42108090/article/details/108410324

版权

目标检测从基础到实践--系列论文讲解专栏收录该内容

53 篇文章 14 订阅 ¥59.90 ¥99.00

订阅专栏

超级会员免费看

该文探讨了动态网络手术（Dynamic Network Surgery）的概念，旨在实现高效深度神经网络（DNNs）。通过为参数添加Mask，根据参数值的大小决定保留或清除，以达到网络压缩的目的。文中提出了使用损失函数的二阶导数来平衡训练损失和模型复杂度。通过Lagrange乘子和梯度下降的方法更新网络权重，并强调更新不重要的参数以提高灵活性。此外，定义了衡量网络连接重要性的函数，并关注模型的收敛速度。最后，给出了一种动态调整阈值以关闭或重新打开参数的策略，其中阈值基于均值和标准差计算。

摘要由CSDN通过智能技术生成

我们给每一个参数添加一个Mask。这个Mask可以和参数进行点乘，从而得到被Mask过滤后的参数。如果Mask上的值为1，那么对应位置的参数将被保留，如果Mask上的值为0，那么对应位置的参数将被清除。

有了Mask，我们问题又来了，每一个参数应该设置成什么值呢？一个直观的方案是根据参数数值的大小来判断，一般来说数值越大，它所起到的作用也越大。所以柿子要捡软的捏，我们可以设定一个阈值，把比阈值小的参数关闭掉，只保留大数值的参数(参数的绝对值小于threshold1这个参数将被关闭)。

但是这又带来了一个新的问题。虽然这些被关闭的参数数值都很小，但是累积起来也是一个很可观的数字，我们这样把它们关闭掉，还是有可能造成精度损失的。于是，当我们把一些参数关闭后，我们还需要重新训练，让参数在新的环境适应——也许会有新的参数变得很小，从而被关闭，当然也有可能有些被关闭的参数死灰复燃（参数的绝对值大于threshold2），变得重要起来。所以设置Mask的值和重新训练两个步骤需要交替进行。
在这里插入图片描述
右边是Han等人的方法，The drawback of Han et al.’