ssd网络结构_环境感知技术入门(十二) 详细解读SSD目标检测框架

最新推荐文章于 2024-05-13 05:25:34 发布

都督Android教学

最新推荐文章于 2024-05-13 05:25:34 发布

阅读量313

点赞数 7

分类专栏： 2024年程序员学习文章标签：目标检测人工智能计算机视觉

本文链接：https://blog.csdn.net/m0_61369523/article/details/137416148

版权

图1 SSD网络结构

1.1 基础VGG结构

图2 骨干网络与原始VGG16对比图

从图2最中我们可以清晰的看到在以VGG16做骨干网络时，在 conv5后丢弃了VGG16中的全连接层改为了1024×3×3和1024×1×1的卷积层。其中 conv4-1卷积层前面的 maxpooling层的 ceil_model=True，使得输出特征图长宽为 38 × 38。还有 conv5-3 后面的一层 maxpooling 层参数为(kernelsize=3,stride=1,padding=1)，不进行下采样。然后在 fc7后面接上多尺度提取的另外 4 个卷积层就构成了完整的 SSD 网络。这里 VGG16 修改后的代码如下，来自 ssd.py:

# This function is derived from torchvision VGG make_layers()
# https://github.com/pytorch/vision/blob/master/torchvision/models/vgg.py
def vgg(cfg, i, batch_norm=False):
    layers = []
    in_channels = i
    for v in cfg:
        if v == 'M':
            layers += [nn.MaxPool2d(kernel_size=2, stride=2)]
        elif v == 'C':
            layers += [nn.MaxP

最低0.47元/天解锁文章

都督Android教学

关注

7
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
ssd网络结构_环境感知技术入门(十二) 详细解读SSD目标检测框架

图1 SSD网络结构图2 骨干网络与原始VGG16对比图从图2最中我们可以清晰的看到在以VGG16做骨干网络时，在 conv5后丢弃了VGG16中的全连接层改为了1024×3×3和1024×1×1的卷积层。其中 conv4-1卷积层前面的 maxpooling层的 ceil_model=True，使得输出特征图长宽为 38 × 38。还有 conv5-3 后面的一层 maxpooling 层参数为(kernelsize=3,stride=1,padding=1)，不进行下采样。
复制链接

扫一扫

专栏目录