12 VGG，NIN

最新推荐文章于 2022-05-14 10:31:48 发布

前程似锦蝈蝈

最新推荐文章于 2022-05-14 10:31:48 发布

阅读量182

点赞数

分类专栏：暑假每日记文章标签：深度学习 pytorch

本文链接：https://blog.csdn.net/qq_45654059/article/details/119930916

版权

暑假每日记专栏收录该内容

15 篇文章 0 订阅

订阅专栏

vgg 利用重复块的网络

与alexnet相比进步的地方在于出现了block结构，可以重复使用此结构来设计网络结构。

vgg_block连续使用连续使用数个相同的填充为1、窗口形状为3×33\times 33×3的卷积层后接上一个步幅为2、窗口形状为2×22\times 22×2的最大池化层。池化层可以使输入高和宽减半。

def vgg_block(num_convs, in_channels, out_channels):
    blk = []
    for i in range(num_convs):
        if i == 0:
            blk.append(nn.Conv2d(in_channels, out_channels, kernel_size=3, padding=1))
        else:
            blk.append(nn.Conv2d(out_channels, out_channels, kernel_size=3, padding=1))
        blk.append(nn.ReLU())
    blk.append(nn.MaxPool2d(kernel_size=2, stride=2)) # 这里会使宽高减半
    return nn.Sequential(*blk) #python通过这种方式变类型。

vgg网络的构成

由5个卷积快组成，前两块是单卷积层，后三块是双卷积层，三个全连接层。一共使用了11层，又叫做VGG-11

conv_arch = ((1, 1, 64), (1, 64, 128), (2, 128, 256), (2, 256, 512), (2, 512, 512))
# 经过5个vgg_block, 宽高会减半5次, 变成 224/32 = 7
fc_features = 512 * 7 * 7 # c * w * h
fc_hidden_units = 4096 # 任意
def vgg(conv_arch, fc_features, fc_hidden_units=4096):
    net = nn.Sequential()
    # 卷积层部分
    for i, (num_convs, in_channels, out_channels) in enumerate(conv_arch):
        # 每经过一个vgg_block都会使宽高减半
        net.add_module("vgg_block_" + str(i+1), vgg_block(num_convs, in_channels, out_channels))
    # 全连接层部分
    net.add_module("fc", nn.Sequential(d2l.FlattenLayer(),
                                 nn.Linear(fc_features, fc_hidden_units),
                                 nn.ReLU(),
                                 nn.Dropout(0.5),
                                 nn.Linear(fc_hidden_units, fc_hidden_units),
                                 nn.ReLU(),
                                 nn.Dropout(0.5),
                                 nn.Linear(fc_hidden_units, 10)
                                ))
    return net

enumerate返回index以及元素。

才用堆积的小卷积核，要优于大的单卷积核，既可以增加网络深度，参数也比较少。

NIN 网络中的网络

LeNet、AlexNet和VGG在设计上的共同之处是：先以由卷积层构成的模块充分抽取空间特征，再以由全连接层构成的模块来输出分类结果

NiN使用1×1卷积层代替全连接层。NiN块由一个卷积层加两个1×1卷积层串联而成。这三个层的空隙之间有三个ReLu，引入非线性变化。

def nin_block(in_channels, out_channels, kernel_size, stride, padding):
    blk = nn.Sequential(nn.Conv2d(in_channels, out_channels, kernel_size, stride, padding),
                        nn.ReLU(),
                        nn.Conv2d(out_channels, out_channels, kernel_size=1),
                        nn.ReLU(),
                        nn.Conv2d(out_channels, out_channels, kernel_size=1),
                        nn.ReLU())
    return blk

NiN使用卷积窗口形状分别为11,5,3的卷积层，每个NiN块后接一个步幅为2、窗口形状为3×3的最大池化层。

net = nn.Sequential(
    nin_block(1, 96, kernel_size=11, stride=4, padding=0),
    nn.MaxPool2d(kernel_size=3, stride=2),
    nin_block(96, 256, kernel_size=5, stride=1, padding=2),
    nn.MaxPool2d(kernel_size=3, stride=2),
    nin_block(256, 384, kernel_size=3, stride=1, padding=1),
    nn.MaxPool2d(kernel_size=3, stride=2), 
    nn.Dropout(0.5),
    # 标签类别数是10
    nin_block(384, 10, kernel_size=3, stride=1, padding=1),
    GlobalAvgPool2d(), 
    # 将四维的输出转成二维的输出，其形状为(批量大小, 10)
    d2l.FlattenLayer())

NiN网络后取消了全连接层，换成NiN块直接将通道数转化为分类数10，用全局平均池化后，高宽维度消失。这种方式减少了模型参数，降低了复杂度，可以缓解过拟合。

前程似锦蝈蝈

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
12 VGG，NIN

vgg 利用重复块的网络与alexnet相比进步的地方在于出现了block结构，可以重复使用此结构来设计网络结构。vgg_block连续使用连续使用数个相同的填充为1、窗口形状为3×33\times 33×3的卷积层后接上一个步幅为2、窗口形状为2×22\times 22×2的最大池化层。池化层可以使输入高和宽减半。def vgg_block(num_convs, in_channels, out_channels): blk = [] for i in range(num_convs
复制链接

扫一扫