Slim （二）

Azure1120

已于 2023-03-10 23:27:33 修改

阅读量373

点赞数

文章标签：人工智能深度学习 Powered by 金山文档

于 2023-02-23 18:33:08 首次发布

本文链接：https://blog.csdn.net/weiyuhaodashabi/article/details/129062363

版权

针对yolo的轻量化第二阶段打算对fpn下手（暂时放一下）

Yolov5现在的Neck和Yolov4中一样，都采用FPN+PAN的结构，但在Yolov5刚出来时，只使用了FPN结构，后面才增加了PAN结构。

在YOLOv4中，Neck的PAN结构是没有引入CSP结构的，但在YOLOv5中作者在PAN结构中加入了CSP。

RepVGG

VGG式”指的是：

没有任何分支结构。即通常所说的plain或feed-forward架构。

仅使用3x3卷积。

仅使用ReLU作为激活函数。

structural re-parameterization technique方法，即结构重参数化。实际上就是在训练时，使用一个类似ResNet-style的多分支模型，而推理时转化成VGG-style的单路模型。如下图所示，图（B）表示RepVGG训练时所采用的网络结构，而在推理时采用图（C）的网络结构。

训练时RepVGG Block并行了三个分支：一个卷积核大小为3x3的主分支，一个卷积核大小为1x1的shortcut分支以及一个只连了BN的shortcut分支。

为什么训练时要采用多分支结构。像Inception系列、ResNet以及DenseNet等模型，我们能够发现这些模型都并行了多个分支。至少根据现有的一些经验来看，并行多个分支一般能够增加模型的表征能力。所以你会发现一些论文喜欢各种魔改网络并行分支。在论文的表6中，作者也做了个简单的消融实验，在使用单路结构时（不使用其他任何分支）Acc大概为72.39，在加上Identity branch以及1x1 branch后Acc达到了75.14。

为什么推理时作者要将多分支模型转换成单路模型。根据论文3.1章节的内容可知，采用单路模型会更快(有的分支计算的快，有的分支计算的慢，而计算快的分支计算完后只能干等着，等其他分支都计算完后才能做进一步融合)、更省内存并且更加的灵活（模型剪枝)。

结构重参数化主要分为两步

第一步主要是将Conv2d算子和BN算子融合以及将只有BN的分支转换成一个Conv2d算子，

3x3和bn层融合成 3x3卷积层

1x1先转化成3x3卷积层再和bn融合

bn 构造一个3x3的恒等映射再和bn融合

第二步将每个分支上的3x3卷积层融合成一个卷积层。关于参数具体融合的过程可以看图中右侧的部分，

合并的过程其实也很简单，直接将这三个卷积层的参数相加即可

RepGhost

Concat特征复用虽然是无参、无FLOPs，但其计算耗时却不能忽视，如下图，随着batch_size增大，Concat与Add的运行延时差距越来越大。

是否可以考虑用Re-parameterization代替Concatenation操作。

(a) 原始的 Ghost 模块（原作者激活函数好像是silu），这里省去了第一步的 1×1 卷积。

(b) 把原始的 Ghost 模块的 Concat 操作换成 Add 操作，以求更高的效率。

(d) 在恒等映射 Identity Mapping 分支中添加 BN 操作，使得在训练过程中带来非线性，并且可以被融合用于快速推断。

(e) 模块 (d) 可以被融合成模块 (e)，用于快速推断。RepGhost 模块有一个简单的推理结构，它只包含规则的卷积层和ReLU，这使得它具有较高的硬件效率。特征融合的过程是在权重空间，而不是在特征空间中进行，然后把两个分支的参数进行融合产生快速推理的结构。

与 Ghost 模块的对比

作用：

Ghost 模块提出从廉价的操作中生成更多的特征图，因此可以以低成本的方式扩大模型的容量。

RepGhost 模块提出了一种更有效的方法，通过重参数化来生成和融合不同的特征图。与 Ghost 模块不同，RepGhost 模块去掉了低效的 Concat 操作，节省了大量推理时间。并且信息融合过程由 Add 操作以隐含的方式执行，而不是留给其他卷积层。

RepGhostNet

Bottleneck改进主要体现在通道数，这是因为Concat到Add的过渡会导致通道数发生变换。作者主要是针对中间通道数进行调整，而输入与输出通道数相同。

，(a) GhostNet 网络的一个 Block。(b) RepGhost 网络训练时的一个 Block。(c) RepGhost 网络推理时的一个 Block。这里值得注意的是 RepGhost 网络的维度问题。对于一个 RepGhost 模块，输出维度等于输入维度；但是对于原来的 Ghost 模块，输出维度是输入维度的2倍。因此为了维持 RepGhost 网络和原始 GhostNet 的维度一致，有个变化需要注意下：