STDN(Scale-Transferrable Object Detection Network)目标识别网络复现-Pytorch

Eticos_CZ

于 2023-03-28 16:29:04 发布

阅读量232

点赞数 1

文章标签：目标检测 pytorch 深度学习

本文链接：https://blog.csdn.net/weixin_45092781/article/details/129757998

版权

论文链接：https://openaccess.thecvf.com/content_cvpr_2018/papers/Zhou_Scale-Transferrable_Object_Detection_CVPR_2018_paper.pdf

复现代码：https://gitee.com/chengze1998/STDN

0 概述

STDN是CVPR 2018的一篇目标检测论文，提出STDN网络用于提升多尺度目标的检测效果。要点包括：（1）使用DenseNet-169作为基础网络提取特征特征提取网络（自带高低层特征融合），基于多层特征做预测（类似SSD），并对预测结果做融合得到最终结果；（2）提出Scale-transfer Layer，在几乎不增加参数量和计算量的情况下生成大尺度的feature map。

1 网络模型

1.1 Densenet

(1条消息) DenseNet算法详解_denseblock参数表_AI之路的博客-CSDN博客

1.2 STDN

在Densenet基础上，STDN在第四个Denseblock嵌入了一个STM模块用于提取特征图和进行目标检测任务。

为了获得高层次的语义多尺度特征图，同时不影响检测器的速度，我们开发了一个尺度转移模块（STM），并将该模块直接嵌入到DenseNet中[14]。DenseNet的作用是在CNN中整合低级和高级特征，以获得更强大的特征。由于网络结构的密集连接，DenseNet的特征自然比普通卷积特征更强大。STM由池化层和标度转移层组成。池化层用于获得小尺度的特征图，标度转移层用于获得大尺度的特征图。尺度转移层最早被提出来做图像超分辨率[28]，因为它的简单性和效率，有些人也用它来做语义分割[30]。我们利用这一层来有效地扩大用于物体检测的特征图的分辨率。（翻译自原文）

STM自然适合基础网络，并能实现端到端的训练。我们认为，STM有两个明显的优势。首先，结合DenseNet[14]，特征图自然拥有低层次的物体细节特征和高层次的语义特征。我们将证明，这将提高物体检测的准确性。第二，STM是由池化层和超分辨率层组成的，没有额外的参数和计算。实验结果表明，本文提出的框架能够准确地检测物体并满足实时性要求。（翻译自原文）

2 代码复现

复现部分是笔者参照了大量的资料和自行摸索的结果，很多地方使用的方法可能会很笨拙，甚至出现纰漏，也期待各位提出意见或建议，谢谢！

本文代码：https://gitee.com/chengze1998/STDN

代码框架以及检测部分参考代码：http://t.csdn.cn/ZoR0B

本文代码部分特别感谢本站@Bubbliiiing的文章，通过

最低0.47元/天解锁文章

Eticos_CZ

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
2
评论
STDN(Scale-Transferrable Object Detection Network)目标识别网络复现-Pytorch

STDN是CVPR 2018的一篇目标检测论文，提出STDN网络用于提升多尺度目标的检测效果。网络骨干基于Densenet密集连接网络。本文是我的Pytorch复现过程和一些心得。
复制链接

扫一扫