[深度学习从入门到女装]SSD

最新推荐文章于 2024-09-12 17:21:30 发布

炼丹师

最新推荐文章于 2024-09-12 17:21:30 发布

阅读量303

点赞数

分类专栏：深度学习文章标签： SSD

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/py184473894/article/details/84658162

版权

深度学习专栏收录该内容

126 篇文章 11 订阅

订阅专栏

论文地址：SSD: Single Shot MultiBox Detector

SSD相对于YOLO的改进

1、anchor

SSD也使用类似Faster R-CNN中的anchor方法，每个feature map的bin会有k个人工设置的anchor，并且不同size的feature map有不同数量和不同scale的anchor，比如上图（b）是8*8的feature map，anchor数量为4，上图（c）是4*4的feature map，anchor数量为4，但是anchor的scale与8*8中的feature map中的anchor不一样

2、使用多尺度feature map进行detection

YOLO只使用了最后一层feature map划分bin然后进行2个anchor的识别与位置计算，SSD提出对于不同layer也就是不同size的feature map都进行anchor的计算

并且进行classifier计算的时候，YOLO中使用的是FC，在SSD中使用的是3*3的不同channel数的卷积

如m*n的feature map，使用p个channel的3*3卷积进行classifier，p=（anchor num*（classes num+4））

整个网络图如上所示，上图为SSD，下图为YOLO，YOLO的主体网络结构使用VGG16，并且使用ILSVRC CLS-LOC进行pre-trained

可以看到YOLO是在7*7feature map上进行每个bin有2个anchor的detection，所以是有7*7*2(anchor数)=98次detection

而SSD从不同layer的feature map都进行detection，

conv4_3：38*38的feature map，使用(4*(classes+4))个channel的3*3卷积核进行detect，有38*38*4(anchor数)=5776次detection

conv7：19*19的feature map，使用(6*(classes+4))个channel的3*3卷积核进行detect，有19*19*6(anchor数)=2166次detection

conv8_2：10*10的feature map，使用(6*(classes+4))个channel的3*3卷积核进行detect，有10*10*6(anchor数)=600次detection

conv9_2：5*5的feature map，使用(6*(classes+4))个channel的3*3卷积核进行detect，有5*5*6(anchor数)=150次detection

conv10_2：3*3的feature map，使用(4*(classes+4))个channel的3*3卷积核进行detect，有3*3*4(anchor数)=36次detection

conv11_2：1*1的feature map，使用(4*(classes+4))个channel的3*3卷积核进行detect，有1*1*4(anchor数)=4次detection

所以SSD一共做了5776+2166+600+150+36+4=8732次detection

最后依旧是使用Non-Maximum Suppression进行最优框的选择得到最后的检测结果

训练过程：

因为SSD是对6层特征图都进行检测，因此数据准备上首先需要将GT和每层特征图的anchor进行匹配

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

炼丹师 CSDN认证博客专家 CSDN认证企业博客

码龄8年

178: 原创

4万+: 周排名

34万+: 总排名

25万+: 访问

: 等级

4313: 积分

205: 粉丝

139: 获赞

90: 评论

729: 收藏

私信

关注

热门文章

分类专栏

最新评论

填坑之作-python实现SVD
qq_34170950: 解决这个问题了吗？，我这正好要用到u，但是就是有列的符号不对
[深度学习从入门到女装]H-DenseUNet: Hybrid Densely Connected UNet for Liver and Tumor Segmentation from CT Volu
HenryLau7: 想问一下，concat那里三张图分别表示的是什么啊，2D的上采样输出的feature map、分割图、和concat过后的图？
pytorch实战-Unet3d（LiTS）
Xiaogentx: 您好，请问您对CT图像的实例分割方面有没有研究呀？大概就是我的CT图像中得到的都是同一类型的颗粒材料（相互接触），但我要将这些颗粒材料进行分割，和这种医学图像的分割好像有一些区别
keras实战-多类别分割loss实现
多思考多睡觉: 博主请问dice loss 为什么是return 1-1-dice_coef_fun呢？那样loss会不会就是负数呢
pytorch实战-Unet3d（LiTS）
鸡肉金轮: hxd，你现在有解决吗，求指点一二

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。