轻量级检测网络Pelee和DenseNet

最新推荐文章于 2024-07-25 21:38:40 发布

huang_nansen

最新推荐文章于 2024-07-25 21:38:40 发布

阅读量3.6k

点赞数 2

分类专栏：深度学习计算机视觉

本文链接：https://blog.csdn.net/huang_nansen/article/details/87207312

版权

深度学习同时被 2 个专栏收录

23 篇文章 3 订阅

订阅专栏

计算机视觉

20 篇文章 1 订阅

订阅专栏

提到轻量级神经网络，大家都会提到MobileNet V1 V2 和 ShuffleNet V1 V2，似乎较少看到大家提到PeleeNet，网上搜到的结果也不多，这篇博客会简单介绍一下PeleeNet以及以它为backbone的检测网络Pelee，还有它的前身DenseNet。

1. DenseNet

这里推荐一篇博文，讲解DenseNet很详细：

https://blog.csdn.net/u014380165/article/details/75142664/

DenseNet发表于2017年的一篇论文Densely Connected Convolutional Networks ，该网络的创新点在于对特征的充分利用，与ResNet相比，DenseNet对特征的利用更加充分，并且通过bottleneck和transition layers降低了计算量。

网络结构图：

图中为一个包含5个层的Dense block我们可以看出，在一个Dense block中，上一层不止会连接下一层，还会连接之后的所有层，并且在Dense block最后，会添加Transition layer来缩小计算量。

跳跃连接是一种解决梯度消失的好方法，ResNet中就使用了这种方法来解决梯度消失。

ResNet中的跳跃连接可以用下面的公式表示，其中H表示非线性变换。

与ResNet不同的是，Dense的非线性变换包含了之前的所有层。

DenseNet的具体网络结构如下：

可以看到，在Dense Block之间，作者使用了Transition layer，一个Transition layer包含一个BN层，一个1x1卷积核的卷积层(卷积核个数为输入个数的一半)和一个2x2的平均池化层。由于网络中后一层与前面所有层相连，到深层网络时，通道数非常大，会导致计算量非常大，作者使用1x1卷积缩小通道数的同时结合了通道间的信息，使用平均池化缩小特征图，降低了计算量。以DenseNet-169为例，Dense Block(3)中第32层需要输入为1248通道，其中一个分支连接另一个分支的输出，另一个分支首先使用bottleneck（1x1卷积）将1248通道缩小为128通道，再进行32通道的3x3卷积，输出的结果与另一个分支相连，得到1248+32=1280通道的特征图，为了进一步缩小计算量，在输入Dense Block(4)之前，作者使用Transition layer，将Dense Block(3)的输出用1x1的卷积缩小为640通道的特征图，并使用2x2，步长为2的平均池化层缩小特征图为原来的一半大小。

2.PeleeNet

PeleeNet是以DenseNet为基础的变型，目的是为了将网络轻量化，应用于移动设备。

网络的主要思想有以下五点：

(1) Two-Way Dense Layer

作者借鉴GoogleNet中多尺度的方法，与Dense Block中的层结合，设计出两路稠密层，一条通道使用1个1x1的卷积核升维，然后接1个3x3的卷积层降维，另一个通道使用1x1卷积升维后，使用2个3x3卷积降维，目的是与另一个通道具有不同感受野。

(2) Stem layer

作者在网络开头使用Stem layer，在增加少量计算量的同时，极大的提升了网络的表达能力。

(3) Dynamic Number of Channels of Bottleneck Layer

在DenseNet中，每一个Dense Block的层中的bottleneck层的通道数都为固定值，作者发现这会导致网络开头一些层中的bottleneck的通道数远超过输入通道数，导致计算量增大。在PeleeNet中，作者动态的设置bottleneck层的通道数。

(4) Transition Layer without Compression

作者发现Transition Layer使用一半输入通道数，会降低网络的表达能力，PeleeNet中Transition Layer的通道数与输入通道数一致。

(5) Composite Function

使用后激活方法代替前激活方式，将relu放在最后，方便后期bn层与conv层结合，提升计算速度。（不知是否理解错误，在官方DenseNet caffe中，relu是放在bn层之后的，也就是后激活方式）

peleeNet模型结构如下：

3. Pelee

PeleeNet作者还提出了以PeleeNet为基础的轻量级检测网络Pelee，与以VGG为基础网络的SSD相比，为了降低计算量，作者使用19x19大小特征图的层作为SSD的第一层预测层。

预测层大小分别为：19 x 19, 10 x 10, 5 x 5, 3 x 3, 1 x 1

MobileNet 同样未使用38 x 38的特征图作为预测层，但添加了2 x 2的预测层来保持6尺度SSD检测。

在我的应用场景中，Pelee的表现远超出了ShuffleNet V2-SSD的表现，也有可能是调参之前没烧香，继续调试中。

huang_nansen

关注

2
点赞
踩
10

收藏

觉得还不错? 一键收藏
0
评论
轻量级检测网络Pelee和DenseNet

提到轻量级神经网络，大家都会提到MobileNet V1 V2 和 ShuffleNet V1 V2，似乎较少看到大家提到PeleeNet，网上搜到的结果也不多，这篇博客会简单介绍一下PeleeNet以及以它为backbone的检测网络Pelee，还有它的前身DenseNet。1. DenseNet这里推荐一篇博文，讲解DenseNet很详细：https://blog.csdn.net...
复制链接

扫一扫

专栏目录