前言
YOLO是一种目标检测方法,它的输入是整张图片,输出是n个物体的检测信息,可以识别出图中的物体的类别和位置。YOLOv3相对v2版本,准确度和速度差不多,但对小目标检测更好。
v3版本主要的改进是使用Darknet-53主干网络提取特征、多尺度特征检测(FPN结构)、预测对象分类采用Logistic取代softmax。
它延续了v2版本部分特点:采用先验框Anchor Boxes、聚类提取先验框尺度、约束预测边框的位置、批归一化BN、去除全连接层。
v1版本没有采用先验框,每个网格只预测两个边界框。这两个边界框“没有预先设计”框的大小和形状,而是模型生成,然后回归调整的;也没有对每个边界框输出一个对象预测,而是一个网格只预测一个对象类别。
论文地址:YOLOv3: An Incremental Improvement
开源代码:https://github.com/pjreddie/darknet
目录