对带有BN结构的网络进行量化感知训练时采用的结构的一些理解

最新推荐文章于 2024-03-05 20:52:08 发布

dawningblue

最新推荐文章于 2024-03-05 20:52:08 发布

阅读量634

点赞数

文章标签：人工智能神经网络量化

本文链接：https://blog.csdn.net/dawningblue/article/details/125934183

版权

本文探讨了在神经网络量化过程中，BN折叠(BN folding)在训练图中的应用。通常BN折叠用于推理阶段，但作者提出可能在量化感知训练中发挥作用。通过分析，得出在ReLU6前的加法操作与BN折叠后的形式相同，揭示了如何在保持参数学习能力的同时进行网络量化。该结构在ResNet等具有快捷连接的网络中常见，其正向传播和反向传播都体现了BN折叠的优势。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

这张图究竟是什么意思

在这里插入图片描述

我理解BN folding是只有在推理的时候才使用的技术，训练的时候不会用到bn folding。但是C.7这个图上说这是training graph, folding，这是怎么回事？
我当时和同事想了很多种可能，最后想到这会不会是在感知量化训练的过程中用到的结构，对于一个具有BN层结构的网络，如果我们需要既要对它进行量化又要对它进行训练，那这个网络应该是什么结构呢？很可能就是这种结构。

在这里插入图片描述