卷积神经网络：DenseNet

最新推荐文章于 2022-07-15 16:17:34 发布

丁天牛

最新推荐文章于 2022-07-15 16:17:34 发布

阅读量948

点赞数

分类专栏： PyTorch卷积神经网络

本文链接：https://blog.csdn.net/weixin_42782833/article/details/119114342

版权

PyTorch卷积神经网络专栏收录该内容

11 篇文章 11 订阅

订阅专栏

DenseNet

ResNet通过前层与后层的“短路连接”(Shortcuts)，加强了前后层之间的信息流通，在一定程度上缓解了梯度消失的现象，从而可以将神经网络搭建得很深。DenseNet最大化了这种前后层信息交流，通过建立前面所有层与后面层的密集连接，实现了特征在通道维度上的复用，使其可以再参数计算量最少的情况下实现比ResNet更优的性能
DenseNet的网络架构如下图所示，网络由多个Dense Block与中间的卷积池化组成，核心就在Dense Block中。Dense Block中的黑点代表一个卷积层，其中的多条黑色线代表数据的流动，每一层的输入由前面的所有卷积层输出组成。注意这里使用了通道的拼接(Concatnate)操作，而非ResNet的逐元素相加操作
在这里插入图片描述
DenseNet的结构有如下两个特效：

神经网络一般需要使用池化等操作缩小特征图尺寸来提取语义特征，而Dense Block需要保持每一个Block内的特征图尺寸一致来进行Concatnate 操作，因此DenseNet被分成了多个Block。Block的数量一般为4
两个相邻的Dense Block之间的部分被称为Transition层，具体包括BN、ReLU、1×1卷积、2×2平均池化操作。1×1卷积的作用是降维，起到压缩模型的作用，而平均池化则是降低特征图的尺寸

Block实现细节如下图所示，每个Block由若干个Bottleneck的卷积层组成，对应上图中的黑点。Bottleneck由BN、ReLU、1×1卷积、BN、ReLU、3×3卷积的顺序构成
在这里插入图片描述

关于Block，有以下4个细节需要注意：

每一个Bottleneck输出的特征通道数是相同的，例如这里的32。同时可以看到，经过Concatnate操作后的通道数是按32的增长量增加的，因此这个32也被称为GrowthRate
这里1×1卷积的作用是固定输出通道，达到降维的作用。当几十个Bottleneck相连接时，Concatnate后的通道数会增加到上千，如果不增加1×1的卷积来降维，后续3×3卷积所需的参数量会急剧增加。1×1卷积的通道数通常是GrowthRate的4倍
上图中的特征传递方式是直接将前面所有层的特征Concatnate后传到下一层，这种方式与具体代码实现的方式是一致的，而不想第一张图中，前面层都要一个剪头指向后面的所有层
Block采用了激活函数在前、卷积层在后的顺序，这与一般的网络是不同的

DenseNet网络的优势主要体现在以下两个方面：

密集连接的特殊网络，使得每一层都会接收其后所有层的梯度，而不是像普通卷积链式反传，因此一定程度上解决了梯度消失的问题
通过Concatnate操作使得大量的特征被复用，每个层独有的特征图的通道是较少的，因此相比ResNet，DenseNet参数更少且计算更高效

DenseNet的不足在于由于需要进行多次Concatnate操作，数据需要被复制多次，显存容易增加得很快，需要一定的显存优化技术。另外DesneNet是一种更为特殊的网络，ResNet则相对一般化一些，因此ResNet的应用更为广泛

利用PyTorch实现DenseNet的一个Block：

import torch
from torch import nn
import torch.nn.functional as F


#实现一个Bottleneck的类，初始化需要输入通道数与GrowthRate这两个参数
class Bottleneck(nn.Module):
    def __init__(self, nChannels, growthRate):
        super(Bottleneck, self).__init__()
        #通常1×1卷积的通道数为GrowRate的4倍
        interChannels = 4*growthRate
        self.bn1 = nn.BatchNorm2d(nChannels)
        self.conv1 = nn.Conv2d(nChannels, interChannels, kernel_size=1,
                               bias=False)
        self.bn2 = nn.BatchNorm2d(interChannels)
        self.conv2 = nn.Conv2d(interChannels, growthRate, kernel_size=3,
                               padding=1, bias=False)

    def forward(self, x):
        out = self.conv1(F.relu(self.bn1(x)))
        out = self.conv2(F.relu(self.bn2(out)))
        #将输入x同计算的结果out进行通道拼接
        out = torch.cat((x, out), 1)
        return out


class Denseblock(nn.Module):
    def __init__(self, nChannels, growthRate, nDenseBlocks):
        super(Denseblock, self).__init__()
        layers = []
        #将每一个Bottleneck利用nn.Sequential()整合起来，输入通道数需要线性增长
        for i in range(int(nDenseBlocks)):
            layers.append(Bottleneck(nChannels, growthRate))
            nChannels += growthRate
        self.denseblock = nn.Sequential(*layers)

    def forward(self, x):
        return self.denseblock(x)

终端：

>>> import torch
>>> from densenet_block import Denseblock
>>> #实例化DenseBlock，包含了6个Bottleneck
>>> denseblock = Denseblock(64, 32, 6)
>>> #查看denseblock的网络结构，由6个Bottleneck组成
>>> denseblock
Denseblock(
  (denseblock): Sequential(
    #第1个Bottleneck的输入通道数为64，输出固定为32
    (0): Bottleneck(
      (bn1): BatchNorm2d(64, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
      (conv1): Conv2d(64, 128, kernel_size=(1, 1), stride=(1, 1), bias=False)
      (bn2): BatchNorm2d(128, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
      (conv2): Conv2d(128, 32, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
    )
    #第2个Bottleneck的输入通道数为96，输出固定为32
    (1): Bottleneck(
      (bn1): BatchNorm2d(96, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
      (conv1): Conv2d(96, 128, kernel_size=(1, 1), stride=(1, 1), bias=False)
      (bn2): BatchNorm2d(128, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
      (conv2): Conv2d(128, 32, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
    )
    #第3个Bottleneck的输入通道数为128，输出固定为32
    (2): Bottleneck(
      (bn1): BatchNorm2d(128, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
      (conv1): Conv2d(128, 128, kernel_size=(1, 1), stride=(1, 1), bias=False)
      (bn2): BatchNorm2d(128, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
      (conv2): Conv2d(128, 32, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
    )
    #第4个Bottleneck的输入通道数为160，输出固定为32
    (3): Bottleneck(
      (bn1): BatchNorm2d(160, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
      (conv1): Conv2d(160, 128, kernel_size=(1, 1), stride=(1, 1), bias=False)
      (bn2): BatchNorm2d(128, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
      (conv2): Conv2d(128, 32, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
    )
    #第5个Bottleneck的输入通道数为192，输出固定为32
    (4): Bottleneck(
      (bn1): BatchNorm2d(192, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
      (conv1): Conv2d(192, 128, kernel_size=(1, 1), stride=(1, 1), bias=False)
      (bn2): BatchNorm2d(128, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
      (conv2): Conv2d(128, 32, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
    )
    #第6个Bottleneck的输入通道数为224，输出固定为32
    (5): Bottleneck(
      (bn1): BatchNorm2d(224, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
      (conv1): Conv2d(224, 128, kernel_size=(1, 1), stride=(1, 1), bias=False)
      (bn2): BatchNorm2d(128, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
      (conv2): Conv2d(128, 32, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
    )
  )
)
>>> input = torch.randn(1, 64, 256, 256)
>>> output = denseblock(input)    #将输入传入denseblock结构中
>>> #输出通道数为224 + 32 = 64 + 32 × 6 = 256
>>> output.shape
torch.Size([1, 256, 256, 256])

丁天牛

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
打赏
0
评论
卷积神经网络：DenseNet

DenseNetResNet通过前层与后层的“短路连接”(Shortcuts)，加强了前后层之间的信息流通，在一定程度上缓解了梯度消失的现象，从而可以将神经网络搭建得很深。DenseNet最大化了这种前后层信息交流，通过建立前面所有层与后面层的密集连接，实现了特征在通道维度上的复用，使其可以再参数计算量最少的情况下实现比ResNet更优的性能DenseNet的网络架构如下图所示，网络由多个Dense Block与中间的卷积池化组成，核心就在Dense Block...
复制链接

扫一扫