YOLO简介
YOLO(You Only Look Once)是一种目标检测的算法,他与之前的RCNN系列的算法有所不同,他舍弃了RCNN中生成proposal region的方法,而是对整张输入图片进行处理,类似于人眼对物体进行全局性的浏览,该算法的名字也因此而来。
RCNN系列算法由于都是基于region proposal方法,通过selected search等方法划分原始图像,并在不同的划分后的region分别训练使用分类器,这花费了巨大的时间,尽管fastCNN和fasterCNN共享了训练分类器的过程,但是生成proposal regions的过程任然消耗大量的时间。而YOLO算法则是直接对输入的图片划分为S*S的网格,在每个网格上回归得到B个回归框bounding boxes,即回归得到检测的目标框信息。由于这一原理特性,YOLO有着以下的优点:
YOLO的优点
- 训练和检测速度快:由于YOLO的网络结构是输入端到输出端端到端整合为一体的网络结构,而不是像RCNN或者FASTERRCNN或者其他滑窗sliding windows技术的算法一样是多个部分组合合成,需要分别训练。而且省去了proposal regions区域的时间。
- 能够考虑整张图片的整体信息:基于生成proposal regions操作的算法由于分类器都是在不同的regions上分别操作,是基于局部信息特征的提取,无法考虑整体图片全局的信息,这也是RCNN产生过多背景错误识别的原因。