Datawhale AI 夏令营第五期从零上手CV竞赛 Task01-CSDN博客

本文链接：https://blog.csdn.net/li_zi_gao/article/details/141575630

一、关于赛题

（1）目的：利用图像处理和计算机视觉技术 开发一套智能识别系统，自动检测和分类摄像头捕获的视频中，城市管理中的违规行为。

（2）提供的数据集：初赛提供城管视频监控数据与对应违规行为标注。违规行为包括垃圾桶满溢、机动车违停、非机动车违停等。视频数据为mp4格式，标注文件为json格式，每个视频对应一个json文件。

（3）评分标准：使用F1score、MOTA指标来评估模型预测结果，对每个json文件得到两个指标的加权求和，最终得分为所有文件得分取均值。

二、浅显认识YOLO

（1）什么是YOLO和物体检测模型？

YOLO是一种流行的实时目标检测系统，其核心思想是将目标检测任务视为一个单一的回归问题，通过一个卷积神经网络（CNN）直接从图像像素到边界框坐标和类别概率的映射。该模型已经过多次迭代，引入了一些新的技术，如更深的网络结构、更好的锚框机制、多尺度特征融合等。

（2）YOLO模型需要什么训练格式？

YOLO使用的标注格式是每张图像一个文本文件，文件名与图像文件名相对应。文本文件中每一行对应一个边界框，格式为：<class> <x_center> <y_center> <width> <height>。其中，<class>是类别索引，<x_center>和<y_center>是边界框中心点相对于图像宽度和高度的比例，<width>和<height>是边界框的宽度和高度相对于图像宽度和高度的比例。

（3）如何训练YOLO模型？

使用Ultraalytics库，该库是一个提供多种计算机视觉模型的库，包括 YOLO 系列。

#Python

from ultralytics import YOLO 

# 设置模型版本 
model = YOLO("yolov8n.pt") 

# 设定数据集和训练参数 
results = model.train(data="yolo-dataset/yolo.yaml", epochs=2, imgsz=1080, batch=16)

（4）如何对模型进行损失评估？