一、目标检测的做法
1.采用滑动窗口,对每个窗口分类和位置修正;
2.RPN的方式先提取候选区域,特征图对应候选区域范围经过roipooling得到所需特征;3.SSD继承RPN类似的anchor机制,设定预设框并对每个预设框赋予groundtruth,全卷积网络训练目标。
二、YOLO的核心思想
YOLO核心思想:YOLO的核心思想就是利用整张图作为网络的输入,直接在输出层回归bounding box的位置和bounding box所属的类别。
Faster R-CNN中也直接用整张图作为输入,但是Faster R-CNN整体还是采用了R-CNN那种
proposal+classifier的思想,只不过是将提取proposal的步骤放在CNN中实现了。
三、YOLO的实现方法
- ① yolo将输入图像划分为 S×S 的网格,物体的中心落在哪一个网格内,这个网格就负责预测该物体的置信度,类别以及位置。
- ② 每个网格要预测B个bounding box,每个bounding box除了要回归自身的位置之外&#