0915含并行连结的网络 GoogLeNet / Inception V3

最新推荐文章于 2024-05-13 14:17:34 发布

不玩游戏的小菜鸡

最新推荐文章于 2024-05-13 14:17:34 发布

阅读量471

点赞数

文章标签：深度学习计算机视觉人工智能

本文链接：https://blog.csdn.net/m0_54028213/article/details/126878776

版权

卷积神经网络 Inception模块 GoogLeNet 深度学习模型复杂度

关键词由CSDN通过智能技术生成

最好的卷积层超参数?
1x1
3x3
5x5
Max pooling
Multiple 1x1
Inception块

四个路径从不同层面抽取信息, 然后在输出通道维合并
输出和输入等同高宽, 变得是通道数
使用不同窗口大小的卷积层, 使用池化层
每条路上通道数可能不同
1x1卷积降低通道数, 来控制模型复杂度
通道数越多, 认为那个路径更重要
Inception块有更少的参数个数和计算复杂度
GoogLeNet

5段, 9个Inception块

段1 & 2: 更小的宽口, 更多的通道

段3: Inception块通道分布不同, 输出通道增加

段4 & 5: 增加通道数, 最后输出1024维特征输出

Inception后续变种

Inception-BN(v2): 使用batch normalization

Inception-V3: 修改了Inception块

替换5x5为多个3x3卷积层, 1x7和7x1卷积层

替换3x3为1x3和3x1卷积层

更深

Inception-V4: 使用残差连接

总结

Inception块用4条有不同超参数的卷积层和池化层的路来抽取不同的信息

它的一个主要优点是模型参数小, 计算复杂度低

GoogLeNet使用9个Inception块, 是第一个达到上百层的网络

后续有一系列改进

import torch
from torch import nn
from torch.nn import functional as F
from d2l import torch as d2l

class Inception(nn.Module):
    # c1--c4是每条路径的输出通道数
    def __init__(self, in_channels, c1, c2, c3, c4, **kwargs):
        super(Inception, self).__init__(**kwargs)
        # 线路1，单1x1卷积层
        self.p1_1 = nn.Conv2d(in_channels, c1, kernel_size=1)
        # 线路2，1x1卷积层后接3x3卷积层
        self.p2_1 = nn.Conv2d(in_channels, c2[0], kernel_size=1)
        self.p2_2 = nn.Conv2d(c2[0], c2[1], kernel_size=3, padding=1)
        # 线路3，1x1卷积层后接5x5卷积层
        self.p3_1 = nn.Conv2d(in_channels, c3[0], kernel_size=1)
        self.p3_2 = nn.Conv2d(c3[0], c3[1], kernel_size=5, padding=2)
        # 线路4，3x3最大汇聚层后接1x1卷积层
        self.p4_1 = nn.MaxPool2d(kernel_size=3, stride=1, padding=1)
        self.p4_2 = nn.Conv2d(in_channels, c4, kernel_size=1)

    def forward(self, x):
        p1 = F.relu(self.p1_1(x))
        p2 = F.relu(self.p2_2(F.relu(self.p2_1(x))))
        p3 = F.relu(self.p3_2(F.relu(self.p3_1(x))))
        p4 = F.relu(self.p4_2(self.p4_1(x)))
        # 在通道维度上连结输出
        return torch.cat((p1, p2, p3, p4), dim=1)

b1 = nn.Sequential(nn.Conv2d(1, 64, kernel_size=7, stride=2, padding=3),
                   nn.ReLU(),
                   nn.MaxPool2d(kernel_size=3, stride=2, padding=1))
b2 = nn.Sequential(nn.Conv2d(64, 64, kernel_size=1),
                   nn.ReLU(),
                   nn.Conv2d(64, 192, kernel_size=3, padding=1),
                   nn.ReLU(),
                   nn.MaxPool2d(kernel_size=3, stride=2, padding=1))
b3 = nn.Sequential(Inception(192, 64, (96, 128), (16, 32), 32),
                   Inception(256, 128, (128, 192), (32, 96), 64),
                   nn.MaxPool2d(kernel_size=3, stride=2, padding=1))
b5 = nn.Sequential(Inception(832, 256, (160, 320), (32, 128), 128),
                   Inception(832, 384, (192, 384), (48, 128), 128),
                   nn.AdaptiveAvgPool2d((1,1)),
                   nn.Flatten())

net = nn.Sequential(b1, b2, b3, b4, b5, nn.Linear(1024, 10))

不玩游戏的小菜鸡

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
0915含并行连结的网络 GoogLeNet / Inception V3

Inception块用4条有不同超参数的卷积层和池化层的路来抽取不同的信息它的一个主要优点是模型参数小, 计算复杂度低GoogLeNet使用9个Inception块, 是第一个达到上百层的网络
复制链接

扫一扫