目标检测
定义
在图像分类的基础上将图像中的物体的位置标注出来
传统算法
- 区域选择(滑动窗口)
- 特征提取(SIFT HOG)
- 区域分类(SVM Adaboost)
- 后处理(NMS过滤框)
弊:算力要求高,适应性差,解决问题有限
深度学习
术语
-
BBox = BoundingBox = 边界框,所有的框物体的框都可以称之为边界框,边界框的两种表示方法,左上角点和右下角点的组合,中心点和宽高的组合。
-
Anchor 锚框,预先设定好比例的一组候选框的集合。
-
RoI(region of interest) /Region proposal 初步提取出来的可能包含物体的区域。
-
Region proposal network:Anchor-based 两阶段提取候选框的网络
-
Intersaction over union:评价预测框的质量,越大则与标准越接近
Anchor-Based Method
用anchor提取候选目标框,在特征图上的每一个点,对anchor进行分类和回归。
缺点:
- 手工设计:设置多少个/多大,长宽比
- 正负样本不均衡问题
- 超参数:如何对不同数据设置?
一阶段
直接对anchor回归和分类最终目标框和类别
算法:
yolo
ssd
retinanet
二阶段
先用anchor回归候选目标框,划分前景和背景。
用候选目标框进一步回归和分类,输出最终目标框和对应的类别
R-CNN系列
Anchor-Free
不用预先设定的anchor,通过预测目标的中心或角点,进行目标检测
基于关键点
先检测目标左上角和右下角点,再通过角点组合形成检测框
Cornernet
基于中心
直接检测物体的中心区域和边界信息,将分类和回归解耦为两个子网
FCOS
CenterNet:Object as points
对比
paddledetection
参考
https://aistudio.baidu.com/aistudio/education/lessonvideo/674954
https://blog.csdn.net/phosphenesvision/article/details/108904450
udio.baidu.com/aistudio/education/lessonvideo/674954
https://blog.csdn.net/phosphenesvision/article/details/108904450