稠密连接网络学习笔记

最新推荐文章于 2024-04-19 21:42:04 发布

卡塞尔学院临时校长

最新推荐文章于 2024-04-19 21:42:04 发布

阅读量597

点赞数

文章标签：卷积

本文链接：https://blog.csdn.net/weixin_43901214/article/details/104931768

版权

Densenet学习笔记

以下内容基于动手学深度学习Pytorch：

构造DenseBlock类时，可以先定义conv_block函数，该函数包括BN、ReLU、Conv2d。相当已打包了一组操作，在DenseNet类中直接调用即可。
DenseBlock类的参数：

num_convs: conv_block的个数，相当于调用conv_block函数的次数。

in_channels: 整个DenseBlock的输入通道数。

out_channels: 不代表DenseBlock最后的输出通道数，而是conv_block中卷积层输出的out_channels。
DenseNet通道数的计算

图一如下

上图为残差网络和稠密连接网络的主要缺别，前后相邻的运算已抽象成模块A和模块B。可以看到残差网络最后用的加权操作，而稠密连接网络最后用的是在通道上的叠加，即在通道维上的concat。

DenseNet：设模块A的初始输出通道为(模块B的输入通道) in_channels，经过模块B之后输出通道为out_channels，所以再进行通道维度连接之后的通道数变为in_channels+out_channels。

如果有多个稠密连接网络串联，那么上一次的输出(通道数为in+out的)将会作为下一层的输入，再走一遍该稠密连接网络，此时经过模块B之后输出通道数仍为out_channels,然后再与原输入进行通道纬度上的叠加，输出通道数就变为in_channels+out_channels+out_channels即in_c+2*out_c

故i个conv_block的DenseNet的最终输出通道数为：in_c+i*out_c

举个例子，如下：

blk=DenseBlock(num_convs=2,in_c=3,out_c=10) #假设之前定义好了DenseNet类，实例化blk
X=torch.rand(4,3,8,8)
Y=blk(X)
Y.shape # torch.Size([4,23,8,8])

简单描述一下就是，有两个convs，即两个稠密块，即把上面图1的流程跑两遍，第一次的输入通道数3，经过卷积之后输出通道数为10，再在通道维度上和原输入相加得到新的通道数为13，此时第二次的输入通道数变为13，模块B卷积之后输出通道数为10，与原图通道维叠加后输出通道数为13+10=23。

由于每个稠密块都会带来通道数的增加，使用过多则会带来过于复杂的模型。过渡层用来控制模型复杂度。

1*1卷积层：来减小通道数
步幅为2的平均池化层：减半高和宽
DenseNet模型结构

先用ResNet开场，Conv2d(1,64,7,2,3)、BN、ReLU、MaxPool2d(3,2,1)

接下来是一个稠密块加一个过渡层（xN），类似于ResNet使用的4个残差块，DenseNet使用的是4个稠密块。

同ResNet一样，我们可以设置每个稠密块使用多少个卷积层。这里我们设成4，从而与ResNet-18保持一致。具体体现的就是num_convs_in_dense_blocks=[4,4,4,4]

稠密块里的卷积层通道数（即增长率growth_rate）设为32，所以每个稠密块将增加128个通道（每个稠密块有4个卷积，可以想成是在上面图1中的流程图里循环四次，每次卷积完都是32，循环四次，增加32x4）。growth_rate再说的具体点就是DenseBlock类中的out_channels参数，也是conv_block函数里的out_channels参数。

使用过渡层来减半高和宽，并减半通道数。

DenseNet模型代码：

net = nn.Sequential(
        nn.Conv2d(1, 64, kernel_size=7, stride=2, padding=3),
        nn.BatchNorm2d(64), 
        nn.ReLU(),
        nn.MaxPool2d(kernel_size=3, stride=2, padding=1))

num_channels, growth_rate = 64, 32  # num_channels为当前的通道数
num_convs_in_dense_blocks = [4, 4, 4, 4] # 4个稠密块，每块里有4个卷积

for i, num_convs in enumerate(num_convs_in_dense_blocks):
    DB = DenseBlock(num_convs, num_channels, growth_rate)
    net.add_module("DenseBlosk_%d" % i, DB)
    # 上一个稠密块的输出通道数（在DenseBlock类中定义.out_channels属性为稠密块最终输出通道数）
    num_channels = DB.out_channels 
    # 在稠密块之间加入通道数减半的过渡层（最后一个稠密块后面不用再加过渡层）
    if i != len(num_convs_in_dense_blocks) - 1:
        net.add_module("transition_block_%d" % i, transition_block(num_channels, num_channels // 2))
        num_channels = num_channels // 2
        
        
#同ResNet一样，最后接上全局池化层和全连接层来输出。
net.add_module("BN", nn.BatchNorm2d(num_channels))
net.add_module("relu", nn.ReLU())
net.add_module("global_avg_pool", d2l.GlobalAvgPool2d()) # GlobalAvgPool2d的输出: (Batch, num_channels, 1, 1)
net.add_module("fc", nn.Sequential(d2l.FlattenLayer(), nn.Linear(num_channels, 10)))