GhostNetv3的Re-parameterization

博观而约取,厚积而薄发

已于 2024-08-06 15:46:38 修改

阅读量195

点赞数 3

分类专栏：深度学习目标检测文章标签：深度学习人工智能机器学习

于 2024-08-06 11:25:55 首次发布

本文链接：https://blog.csdn.net/mddCSDN/article/details/140950312

版权

目标检测同时被 2 个专栏收录

16 篇文章 1 订阅

订阅专栏

深度学习

4 篇文章 0 订阅

订阅专栏

GhostNetv3的Re-parameterization

在GhostNetV3中，重参数化是一种在训练阶段引入的技术，用于提高模型性能，而在推理阶段则通过逆向重参数化过程去除多余的分支，以避免增加额外的计算成本。具体来说，在训练过程中，深度卷积和1×1卷积中引入了线性并行分支，这些分支在训练后可以重新参数化，在推理时不会带来额外的成本。这是因为卷积和BatchNorm运算在推理过程中都是线性的，可以折叠成单个卷积层，其权重矩阵和偏置可以重参数化为所有分支的权重和偏置的总和。

在推理时，通过逆向重参数化过程，可以删除重复的分支。这一过程涉及将所有分支中的折叠权重和偏差重参数化，从而实现在推理时减少计算量的目的。具体地，权重和偏差的重参数化可以通过以下公式表示：。

此外，另一篇博客文章也提到了重参数化的概念，指出在推理时卷积和BatchNorm操作可以组合成一个卷积层，并且可以逆向重参数化以删除重复分支。这表明在GhostNetV3中，重参数化是一种有效的训练策略，可以在不牺牲推理效率的情况下提高模型的训练性能。

在深度学习中，卷积层和批量归一化层（BatchNorm）都是线性操作，这意味着它们可以按顺序组合或“折叠”成一个单一的线性层，而不改变网络的学习能力。这种技术在推理时特别有用，因为它可以减少计算量。

理解并行分支合并

在训练过程中，BatchNorm层确实在寻找最佳的均值和方差，以便对每个特征通道的输入数据进行归一化处理。

重参数化过程的关键点：

分离 BN 参数：首先，使用 _fuse_bn_tensor 方法将每个分支的卷积层和其后的 BN 层的参数分离出来。这个方法返回卷积核和偏置，其中 BN 层的参数被融合进卷积核和偏置中。
合并卷积核和偏置：对于每个分支（主分支和廉价分支），其卷积核和偏置被分别累加，以形成一个单一的卷积核和偏置。如果有 skip 连接或 scale 连接，它们也会被合并进来。
创建新的卷积层：使用合并后的卷积核和偏置创建新的卷积层 self.primary_conv 和 self.cheap_operation，这些层将用于推理。
删除未使用的分支：推理模式下不再需要原始的多分支结构，因此它们被从模型中删除。