论文笔记:YOLO
简介
这是CVPR2016的一篇很经典的目标检测论文,一阶段目标检测鼻祖,提出了一个非常实时的目标检测算法。YOLO把检测问题视为一个单纯的回归问题,比起之前的算法,YOLO预测出假阳性结果(把背景预测成某个类别)的可能性比较低,但是位置误差比较大。当然,YOLO最大的特点就是速度快,可以实现实时检测。
方法
- 将图片分成S*S个格子(s=7)
- 每个格子负责预测中心B个(B=2)落在格子内的物体的检测框和1个类别,x,y,w,h,confidence(都是0-1),和类别(20类的话,就是20个0-1范围的数字表示每个类别的概率),也就是网络输出尺寸是一个20+2*5的向量
- 通过每个格子预测出的向量,就可以知道所有的检测结果(检测框中心位置、尺寸、confidence、类别),再通过设置阈值和NMS,就可以把符合要求的结果筛选出来。
网络设计
训练
loss采用S