🧾 1. 项目简介
目标检测是计算机视觉中至关重要的研究方向之一,其目标是在图像中定位并识别出所有感兴趣的物体。本文将介绍如何基于YOLOv5模型,使用大规模的Open Images数据集,实现一个600类通用目标检测系统,并通过 PyQt5 构建一个图形化界面,支持图像和摄像头的实时检测展示。
📚 2. Open Images 数据集详解
Open Images 是由 Google 发布的一个大规模图像数据集,旨在推动计算机视觉领域的发展。
🧾 2.1 数据集组成
- 图像数量:约900万张
- 图像级标签:约3000万个,涵盖约2万个概念
- 边界框标注:约1500万个,涵盖600个对象类别
- 视觉关系标注:375,000个,涉及57个类别
- 平均每张图像的对象数:约8个