主要参考两篇综述论文
Object Detection in 20 Years: A Survey
Recent Advances in Deep Learning for Object Detection
csdn上有翻译版,对照这翻译版,能够更快的理解,注意如果是菜鸟,最好review三遍,三遍是我从高中时期总结出来的高效学习方法,大学和工作后也一直在实践.
https://blog.csdn.net/clover_my/article/details/92794719
以下是阅读时,记录的一些问题.
目标检测难点有哪些
光照,尺度,姿态,遮挡,精细定位(这个应该属于分割要解决的事情),实时性,负样本挖掘
精简历史
-
VJ detector,了解adaboost原理,另外区分清楚xgboost, gbdt区别,
-
HOG+SVM
-
DPM,这里面已经有bounding box regression, hard negative sample mining, context priming,我记得还有个积分通道特征,该文章在speed up部分提到了下.
-
经典网络结构,lenet5, alexnet, vgg, inception, resnet,densenet, senet由于有了强大的网络可以学习到物体的特征(feature map),后面衍生出一些基于深度学习的目标检测方法
-
two stage
- faster RCNN, 需要细致分析网络结构
- FPN,
-
one stage
- yolo, 要了解v1,v2,v3的改进
- ssd
- retina-net
multi-scale问题
- 特征金字塔+滑动窗
- object proposal
- bounding box regression
- multi reference & multi resolution
hard negative mining
- bootstrap
- focal loss
speed up
- 特征减少空间(权值共享)和尺度(特征金字塔)冗余
- 加速分类器
- 级联检测
- 网络剪裁和量化
- 轻量化网络设计
- 分解卷积
- Group Convolution
- Depth-wise Separable Convolution
后面的我就不熟悉了,