🧾 1. 项目简介
目标检测是计算机视觉中至关重要的研究方向之一,其目标是在图像中定位并识别出所有感兴趣的物体。本文将介绍如何基于YOLOv5模型,使用经典的PASCAL VOC数据集,实现一个20类通用目标检测系统,并通过 PyQt5 构建一个图形化界面,支持图像和摄像头的实时检测展示。
📚 2. PASCAL VOC 数据集详解
PASCAL VOC(Visual Object Classes Challenge)是目标检测任务中最早的标准数据集之一。它被广泛用于评估分类、目标检测、图像分割等算法。
🧾 2.1 数据集组成
- 常用年份:VOC2007、VOC2012
- 图像数量:VOC2007约9963张,VOC2012约11530张
- 标注格式:XML(Pascal VOC格式)
- 标注内容:类别、边界框、难度标签