【深度学习】从新视角 综述 Detection算法

前言

论文看多了容易乱,所以想从一些细节实现的区别,来综述detection算法。

Stage 设计

全流程包含几个stage。

Stage NumAlgorithm
4R-CNN、SPPNet、Cascade R-CNN
2Fast R-CNN、Faster R-CNN、R-FCN、Mask R-CNN、Light-head R-CNN、SNIP、R-FCN-3000、SNIPER
1YOLOv1、SSD、YOLOv2、DSSD、RetinaNet、YOLOv3

End-to-end 设计

是否符合end-to-end。

End-to-endAlgorithm
×R-CNN、SPPNet
Fast R-CNN、Faster R-CNN、YOLOv1、SSD、R-FCN、YOLOv2、DSSD、Mask R-CNN、RetinaNet、Light-head R-CNN、SNIP、R-FCN-3000、YOLOv3、SNIPER

Subnet 设计

后半段网络(subnet)是否尺寸为RoI-wise。

RoI-wise subnetAlgorithm
×YOLOv1、SSD、YOLOv2、DSSD、RetinaNet、YOLOv3、R-FCN、Light-head R-CNN、R-FCN-3000
R-CNN、SPPNet、Fast R-CNN、Faster R-CNN、Mask R-CNN、SNIP、Cascade R-CNN、SNIPER

Scale 设计

如何利用scale。

Scale HandlingAlgorithmSample Diagram
Image PyramidSNIP、SNIPER这里写图片描述
Single FeatureR-CNN、SPPNet、Fast R-CNN、Faster R-CNN、YOLOv1、R-FCN、Light-head R-CNN、R-FCN-3000这里写图片描述
Pyramidal FeatureSSD、YOLOv2这里写图片描述
Feature Pyramid NetworkFPN、DSSD、Mask R-CNN、Cascade R-CNN、PAN这里写图片描述

减法设计

各自在传统设计套路上做了哪些“减法”。

Decrease repetitionAnnotation
SPPNet去除卷积的重复抽取
Fast R-CNN去除卷积的重复抽取
R-FCN去除RoI-wise network的重复计算
Light-head R-CNN去除每个类都要单独进行的location regression
R-FCN-3000去除每个类都要单独进行的location regression

加法设计

各自在传统设计套路上做了哪些“加法”。

Increase repetitionAnnotation
SSD增加feature map的选取数量
YOLOv2增加feature map的选取数量
FPN增加feature map的选取数量
SNIP增加image scale的数量
Cascade R-CNN增加RoI-wise network的数量
PAN增加feature map的选取数量

Basemodel 设计

论文原作采用的是什么basemodel。

AlgorithmAlexNetZFNetGoogleNetVGGNetDarkNetResNetFPN(+ResNet)PAN(+ResNet)DetNet
R-CNN
SPPNet
Fast R-CNN
Faster R-CNN
YOLOv1
SSD
R-FCN
YOLOv2
FPN
DSSD
Mask R-CNN
DCN
RetinaNet
Light-head R-CNN
Relation Network
SNIP
Cascade R-CNN
R-FCN-3000
PAN
YOLOv3
DetNet
SNIPER

Classification 设计

如何设计尾部的分类器。

AlgorithmSVMSoftmax lossFocal loss
R-CNN
SPPNet
Fast R-CNN
Faster R-CNN
YOLOv1
SSD
R-FCN
YOLOv2
FPN
DSSD
Mask R-CNN
DCN
RetinaNet
Light-head R-CNN
Relation Network
SNIP
Cascade R-CNN
R-FCN-3000
PAN
YOLOv3
DetNet
SNIPER

Reg_loss 设计

回归loss是如何选择的。

AlgorithmL2 lossSmooth L1 loss
R-CNN
SPPNet
Fast R-CNN
Faster R-CNN
YOLOv1
SSD
R-FCN
YOLOv2
FPN
DSSD
Mask R-CNN
DCN
RetinaNet
Light-head R-CNN
Relation Network
SNIP
Cascade R-CNN
R-FCN-3000
PAN
YOLOv3
DetNet
SNIPER

Encode/Decode 设计

检测框的 “编解码” 操作选用的是什么方案。

Role: normalize the target, making the regression task simple.

AlgorithmThe earliest target [ x c w a , y c h a , log ⁡ w , log ⁡ h ] [\frac{x_c}{w_a}, \frac{y_c}{h_a}, \log{w}, \log{h}] [waxc,hayc,logw,logh]Others
R-CNN
SPPNet
Fast R-CNN
Faster R-CNN
YOLOv1
SSD
R-FCN
YOLOv2
FPN
DSSD
Mask R-CNN
DCN
RetinaNet
Light-head R-CNN
Relation Network
SNIP
Cascade R-CNN
R-FCN-3000
PAN
YOLOv3
DetNet
SNIPER
  • 2
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值