单阶段检测器
(1)yolo
1)网格式的检测方式
2)综合整张图的信息预测各个位置的物体
3)yolo(2015), yolo9000(2016)
(2) ssd
1)吸纳两阶段检测器的优秀设计,并进行改良
2)ssd(2015),dssd(2017)
(3)retinanet(2017)
1)大幅度提升单阶段检测器的精度
yolo
(1)方法:
1)将图像划分成网格,在每个网格中预测物体边框
2)每个物体边框的预测都以整张图的特征作为输入
3)检测精度与速度:在gpu上最快能达到155fps
4)存在问题:小尺度物体,密集排布的物体,检测框的准确性
ssd
(1)single-shot
1)单阶段:不生成候选窗口,直接给出检测结果
2)如何保证精度?对不同长宽比的物体,用不同的predicator;多尺度:在不同尺度的特征图上进行预测
dssd
(1)动机
1)为更小目标增加更多上下文信息:将深层特征和浅层特征相融合;深层特征具有较大感受野,能够提供上下文信息
dssd在最后进行反卷积
(2)方法:类别和边框:改进的预测模块;特征融合(浅层与深层)
(3)实验:类别和边框的预测:带跨层连接的预测模块更好;特征融合:相乘比相加更好;速度与精度的比较
retinanet
1)问题:单阶段检测器在精度上通常落后于两阶段检测器;主要原因:样本不平衡:1)背景区域远多余物体区域2)大部分背景很容易和物体区分开来:对模型学习只能提供非常有限的指导,数量上占主导->学习到不好的模型
2)现有办法:难以挖掘,只使用部分的样本
3)解决方案:focal loss:使用所有样本,但是对样本给予不同的权重
4)实验:和单阶段检测器相仿速度;超过两阶段检测器的检测精度
总结: