文章目录
1.目标检测的主流算法
- two-stage
以R-CNN,Fast R-CNN,Faster R-CNN等为代表的两阶段结构。产生一系列稀疏的候选框,然后对这些候选框进行分类与回归,two-stage方法的优势是准确度高。 - one-stage
以YOLO、SSD等方法为代表的Single-Shot结构。该结构为真正的端到端训练。其主要思路是均匀地在图片的不同位置进行密集抽样,抽样时可以采用不同尺度和长宽比,然后利用CNN提取特征后直接进行分类与回归,整个过程只需要一步,所以其优势是速度快,但是均匀的密集采样的一个重要缺点是训练比较困难,这主要是因为正样本与负样本(背景)极其不均衡(参见Focal Loss),导致模型准确度稍低。
ssd
yolo
对比SSD和YoLo,SSD采用CNN直接进行检测,而非向Yolo在全连接之后进行检测,一是SSD提取了不同尺度的特征图来做检测,大尺度特征图(较靠前的特征图)可以用来检测小物体,而小尺度特征图