You Only Look Once: Unified, Real-Time Object Detection
论文链接:https://arxiv.org/pdf/1506.02640.pdf
yolo官网:https://pjreddie.com/darknet/yolo/
摘要
提出yolo是一个目标检测模型。之前做目标检测是在已有的检测结果上再做分类,而yolo模型把目标检测看成一个回归问题处理,每张图片被分解成若干个独立的边界框并预测所属类别概率。使用一个简单的神经网络只需评估一次就能直接从所有图片中预测边界框和所属类别的概率。由于整个检测过程是在一个简单的网络中进行,所以可以端对端的直接优化检测性能。
统一网络结构很快。基础的yolo模型处理图像速度为45帧每秒。简易版yolo,即fast yolo,处理图像速度为155帧每秒,而且mAP值是其他实时检测模型的两倍以上。与现在最新的检测系统相比,yolo模型的定位错误率更高,但是不会将背景预测成物体。最后,yolo模型学习到物体非常通用的特征。当从自然图像迁移到其他领域,如艺术领域,yolo模型比DPM和R-CNN等模型检测结果好。
yolo模型
Yolo处理图像是简单直接的,具体步骤如下:
- 将输入图像调整尺寸为448*448;
- 将输入图像读入设计的简单的卷积神经网络中;
- 通过模型置信度设置检测结果的阈值。
Yolo很简单只需一个简单的神经网络就能预测多边界框和分类概率。Yolo训练所有图片并优化检测性能。yolo比传统检测算法的优点有:(1)yolo实时性好;(2)当一个网格中存在一组概率值时