YOLO系列论文综述(从YOLOv1到YOLOv11)【第10篇:YOLOv8——集成检测、分割和跟踪能力】


YOLO系列博文:

  1. 【第1篇:概述物体检测算法发展史、YOLO应用领域、评价指标和NMS】
  2. 【第2篇:YOLO系列论文、代码和主要优缺点汇总】
  3. 【第3篇:YOLOv1——YOLO的开山之作】
  4. 【第4篇:YOLOv2——更好、更快、更强】
  5. 【第5篇:YOLOv3——多尺度预测】
  6. 【第6篇:YOLOv4——最优速度和精度】
  7. 【第7篇:YOLOv5——使用Pytorch框架、AutoAnchor、多尺度预训练模型】
  8. 【第8篇:YOLOv6——更高的并行度、引入量化和蒸馏以提高性能加速推理】
  9. 【第9篇:YOLOv7——跨尺度特征融合】
  10. 【第10篇:YOLOv8——集成检测、分割和跟踪能力】
  11. 【第11篇:YOLO变体——YOLO+Transformers、DAMO、PP、NAS】
  12. 【第12篇:YOLOv9——可编程梯度信息(PGI)+广义高效层聚合网络(GELAN)】
  13. 【第13篇:YOLOv10——实时端到端物体检测】
  14. 【第14篇:YOLOv11——在速度和准确性方面具有无与伦比的性能】
  15. 【第15篇(完结):讨论和未来展望】

1 摘要

  • 发布日期:2023年1月
  • 作者:Ultralytics团队
  • 论文:无
  • 代码https://github.com/ultralytics/ultralytics
  • 主要优缺点
    • 提供可定制的模块化设计方便用户根据需求进行扩展;
    • 内置多种训练和超参数优化策略简化模型调优过程;
    • 集成检测、分割和跟踪功能。

2 网络架构

YOLOv8于2023年1月由开发YOLOv5的公司Ultralytics发布。YOLOv8提供了五个不同规模的版本:YOLOv8n(nano)、YOLOv8s(small)、YOLOv8m(medium)、YOLOv8l(large)和YOLOv8x(extra large)。YOLOv8支持多种视觉任务,如目标检测、分割、姿态估计、跟踪和分类。

下图展示了YOLOv8的详细架构。
网络架构
YOLOv8使用了与YOLOv5类似的Backbone,但在CSPLayer上进行了一些改动,称为C2f模块。C2f模块(带有两个卷积的跨阶段部分瓶颈)结合了高级特征和上下文信息,以提高检测精度。

YOLOv8使用无锚框模型,并采用解耦头来独立处理物体性(objectness)、分类和回归任务。这种设计允许每个分支专注于其特定任务,从而提高模型的整体准确性。在YOLOv8的输出层中,他们使用Sigmoid函数作为物体性的激活函数,表示边界框包含物体的概率。对于类别概率,则使用Softmax函数,表示物体属于每个可能类别的概率。

YOLOv8使用CIoU和DFL损失函数来进行边界框损失计算,并使用二元交叉熵进行分类损失计算。这些损失函数改进了目标检测性能,特别是在处理较小物体时。

YOLOv8还提供了一个名为YOLOv8-Seg的语义分割模型,该模型的骨干网络是CSPDarknet53特征提取器,后接C2f模块而不是传统的YOLO颈部结构。C2f模块之后有两个分割头,学习预测输入图像的语义分割掩码。

该模型具有与YOLOv8相似的检测头,包括五个检测模块和一个预测层。YOLOv8-Seg模型在各种目标检测和语义分割基准测试中取得了SOTA的结果,同时保持了高速度和高效率。

YOLOv8可以通过命令行界面(CLI)运行,也可以作为PIP包安装。此外,它还提供了多种用于标注、训练和部署的集成工具。

在MS COCO 2017测试开发集上的评估显示,YOLOv8x在640像素的图像尺寸下达到了53.9%的AP,相比之下,YOLOv5在同一输入尺寸下的AP为50.7%。在NVIDIA A100和TensorRT的支持下,YOLOv8x的速度达到了280 FPS。

3 优缺点

  • 提供可定制的模块化设计方便用户根据需求进行扩展;
  • 内置多种训练和超参数优化策略简化模型调优过程;
  • 集成检测、分割和跟踪功能。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值