【深度学习】从新视角综述 Detection算法

JNingWei

已于 2023-01-25 15:08:14 修改

阅读量1k

点赞数 2

分类专栏：深度学习文章标签：深度学习算法目标检测

于 2018-06-10 19:29:41 首次发布

本文链接：https://blog.csdn.net/JNingWei/article/details/80643873

版权

79 篇文章 60 订阅

订阅专栏

论文看多了容易乱，所以想从一些细节实现的区别，来综述detection算法。

全流程包含几个stage。

Stage Num	Algorithm
4	R-CNN、SPPNet、Cascade R-CNN
2	Fast R-CNN、Faster R-CNN、R-FCN、Mask R-CNN、Light-head R-CNN、SNIP、R-FCN-3000、SNIPER
1	YOLOv1、SSD、YOLOv2、DSSD、RetinaNet、YOLOv3

是否符合end-to-end。

End-to-end	Algorithm
×	R-CNN、SPPNet
√	Fast R-CNN、Faster R-CNN、YOLOv1、SSD、R-FCN、YOLOv2、DSSD、Mask R-CNN、RetinaNet、Light-head R-CNN、SNIP、R-FCN-3000、YOLOv3、SNIPER

后半段网络（subnet）是否尺寸为RoI-wise。

RoI-wise subnet	Algorithm
×	YOLOv1、SSD、YOLOv2、DSSD、RetinaNet、YOLOv3、R-FCN、Light-head R-CNN、R-FCN-3000
√	R-CNN、SPPNet、Fast R-CNN、Faster R-CNN、Mask R-CNN、SNIP、Cascade R-CNN、SNIPER

如何利用scale。

Scale Handling	Algorithm	Sample Diagram
Image Pyramid	SNIP、SNIPER
Single Feature	R-CNN、SPPNet、Fast R-CNN、Faster R-CNN、YOLOv1、R-FCN、Light-head R-CNN、R-FCN-3000
Pyramidal Feature	SSD、YOLOv2
Feature Pyramid Network	FPN、DSSD、Mask R-CNN、Cascade R-CNN、PAN

各自在传统设计套路上做了哪些“减法”。

Decrease repetition	Annotation
SPPNet	去除卷积的重复抽取
Fast R-CNN	去除卷积的重复抽取
R-FCN	去除RoI-wise network的重复计算
Light-head R-CNN	去除每个类都要单独进行的location regression
R-FCN-3000	去除每个类都要单独进行的location regression

各自在传统设计套路上做了哪些“加法”。

论文原作采用的是什么basemodel。

如何设计尾部的分类器。

回归loss是如何选择的。

检测框的 “编解码” 操作选用的是什么方案。

Role: normalize the target, making the regression task simple.