最近一直在用yolo做目标检测,速度上的效果确实比rcnn、fast_rcnn以及faster_rcnn快得多了,达到了实时检测的速度。其主要的训练机制跟它们也不一样,把检测看作是一种回归的问题,其主要的特点就是: (1)整个图片进行训练,检测的时候也是整个图片进行检测直接获得bounding boxes和class probabilities。
(2)损失函数的设计。
(3)针对lager object和small object对h和w的偏差带来误差的敏感度不一样,对损失函数进行修改。
(4)网络结构参考Googlenet,没有引用Googlenet的inception机制。
1、论文摘要
(1)基础YOLO模型以45帧/秒的速度实时处理图像,与最先进的检测系统相比,YOLO产生了更多的定位误差,但不太可能在背景上的预测假阳性。