Detection with Enriched Semantics(DES)算法笔记

DES算法是CVPR2018提出的一种改进SSD的方法,旨在解决小目标检测问题。通过引入segmentation module和global activation module增强特征语义信息,提高检测性能。实验表明,DES在VOC2007和VOC2012数据集上的mAP表现优秀,尤其是在小目标检测上效果显著。
摘要由CSDN通过智能技术生成

论文:Single-Shot Object Detection with Enriched Semantics
论文链接:https://arxiv.org/abs/1712.00433

Detection with Enriched Semantics(DES)是CVPR2018的文章,基于SSD做改进,也是为了解决SSD中对于小目标物体的检测效果不好的问题,因为SSD算法对小目标的检测只是利用了浅层的特征,并没有用到高层的语义特征。因此这篇文章的出发点就是为了增加用于检测的feature map的语义信息,主要的措施包括:1、引入segmentation module用于得到attention mask,从而提高low level的feature map的语义信息。2、引入global activation module用于提高high level的feature map的语义信息。实验效果不错,在VOC2007数据集上,DES512能达到81.7的mAP,而且在Titan X上的速度是31.7FPS(batch设置为8,不过比相同大小输入和相同特征提取网络的SSD算法慢一些)。

Figure1是DES算法的整体结构,主要包含3个部分:1、detection branch。这部分基本上和SSD没有太大差别。2、segmentation module。这部分主要针对low level的feature map,用来增强low level的feature map的语义信息。具体做法就是以conv4_3和bounding box level的segmentation ground truth作为输入,bounding box level的segmentation ground truth就是Figure1中左下角那个黑色中带黄色的矩形,那个黄色区域的边框原来是bounding box的ground truth,这里将其内部区域当作segmentation的ground truth。3、global activation module。这部分主要针对high level的feature map,也是类似attention的思想,最终增强high level的feature map的语义信息。

评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值