《TridentNet：Scale-Aware Trident Networks for Object Detection》论文笔记

最新推荐文章于 2020-11-11 21:44:45 发布

m_buddy

最新推荐文章于 2020-11-11 21:44:45 发布

阅读量367

点赞数

分类专栏： # General Object Detection 文章标签： TridentNet

本文链接：https://blog.csdn.net/m_buddy/article/details/100175369

版权

TridentNet是一种优化目标检测性能的网络结构，通过在Faster R-CNN基础上增加共享参数的多分支结构，利用不同膨胀系数的卷积获取不同感受野，适应不同尺度目标。该方法在COCO数据集上实现48.4% mAP，表明感受野对检测性能有显著影响。网络设计包括Trident-block，其中分支共享权重，减少过拟合和计算成本，并采用类似SNIP的尺度划分训练策略。

摘要由CSDN通过智能技术生成

代码地址：TridentNet

1. 概述

导读：对于检测网络来说网络的深度、stride大小与感受野会直接影响检测性能，对于网络的深度与stride大小已经有很多前人的工作在里面了，这篇文章从感受野的角度去优化检测网络（着力于不同的目标尺度），从而在Faster RCNN的基础上进行对应的改进提出了TridentNet。该网络在一个backbone上添加一个平行的多分支结构（分支上的参数共享，使用不同膨胀系数获取不同大小的感受野），之后使用SNIP文章中对不同目标分开训练和预测的方式适应不同尺度范围的目标（这个思路是不是有点像ASPP、RFBNet呢？）。这篇文章的算法在COCO数据上使用backbone为ResNet-101的网络实现了48.4的mAP。

在检测任务中不同尺度大小的目标会给检测带来难度，对于不同大小的目标像图像金字塔与特征金字塔是典型的思路，特别是特征金字塔（FPN）在现有的检测算法框架下基本上成为了标配，但由于FPN网络对于不同尺度目标的表达能力不尽相同，这在一定程度上使得PFN达不到图像金字塔的性能。

其实这两个尺度适应的方法都理解为从不同的感受野上去表达不同尺度上的目标。这篇文章也是从感受野的角度去解决不同尺度范围的目标对于检测带来的影响，而且这里使用的思路是使用共享参数的多分支的膨胀卷积去实现的。这里将文章的方法与图像金字塔、特征金字塔进行比较，他们的差异见图1所示：
在这里插入图片描述
这篇文章提出的检测算法大致结构如上图1（c）所示，这个算法是在输出特征图上使用不同膨胀系数的卷积去获取不同的感受野，而且这些不同膨胀系数所在的分支权值共享，其输出的预测结果会根据目标的尺度范围给目标划定所在的表达分支。