作者:禅与计算机程序设计艺术
1.简介
YOLO(You Only Look Once,一种目标检测算法)是由等人于2015年提出的,其创新点是结合了神经网络、CNN和目标检测技术。该算法能够在不耗费过多计算资源的情况下,实时地对大量的目标进行识别,并准确给出位置坐标。
YOLO的主要优点:
- 在目标检测任务上表现优秀,精度高、速度快;
- 模型大小小,模型参数少,部署便捷;
- 不依赖于特定场景的训练集,泛化能力强;
- 完全基于端到端的训练,不需要复杂的预处理过程。
YOLOv3算法的结构如下图所示:
YOLOv3由五个部分组成:
- Backbone Network(骨干网络):提取图像特征,包括卷积层、池化层和线性层。YOLOv3用DarkNet-53作为backbone network,该网络是AlexeyAB团队于2018年提出的,具有良好的精度和效率,可用于目标检测任务中。
- Feature Pyramid Network(特征金字塔网络):生成不同尺度的特征图,分别用来预测不同尺度的目标。
- Localization Network(定位网络):将不同尺度的特征图映射到相同的维度,得到预测框及其类别置信度。
- Classifier Network(分类网络):通过对每个预测框进行类别预测,确定物体类别及其置信度。
- Loss Function(损失函数ÿ