two stage
faster R-CNN:将检测问题分为两步-首先产生候选区域region proposal,然后再分类
特点:错误率低,速度慢
one stage
SSD,YOLO:直接产生物体的类别概率和位置坐标值,经单次检测直接得到最终结果
特点:检测速度快
- VGG16
- SSD
2016年提出,基于VGG16主网络;
感受野:
anchor:
特征金字塔
浅层卷积层得到物体的边缘信息,深层网络得到更细节更抽象的特征
LOSS计算
SSD算法的目标函数:计算对应的预选框与目标类别的confidence loss以及相应的位置回归
Match策略
Hard negative mining
选取误差较大的top-k作为训练的负样本,positive:nagative=1:3
Data augmentation
每个训练图像随机采样
1、随机采样一个区域
2、整个原始输入图像
3、采样一个区域,采样区域和原始图片最小的交并比为
SSD结果分析
缺点:需要人工设置prior box
- YOLOv1
结构
利用整张图作为网络的输入,将检测问题作为回归问题,直接再输出层回归预选框的位置及其所属的类别
预测工作流程
代价函数
loss:位置误差,confidence误差,分类误差
缺点
YOLOv2
速度和精度的优化。
大多数检测网络依赖于VGG-16作为特征提取网络;YOLO使用的基于GoogleNet的自定制网络,作者使用Darknet-19在标准1000类的imageNet训练了160周期。
改进:
【1】
【2】
【3】
【4】直接位置预测
【5】细粒度特征Fine-Grained Features
【6】Multi-Scale Training
YOLOv3
基础框架为Darknet-53;有3个不同特征尺度的输出:1313255, 2626255, 5252255
- 目标检测任务标注
labelimg window版本