Datawhale AI 夏令营第五期 从零上手CV竞赛 Task01

一、关于赛题

(1)目的:利用图像处理和计算机视觉技术 开发一套智能识别系统,自动检测和分类摄像头捕获的视频中,城市管理中的违规行为。

(2)提供的数据集:初赛提供城管视频监控数据与对应违规行为标注。违规行为包括垃圾桶满溢、机动车违停、非机动车违停等。视频数据为mp4格式,标注文件为json格式,每个视频对应一个json文件。

(3)评分标准:使用F1score、MOTA指标来评估模型预测结果,对每个json文件得到两个指标的加权求和,最终得分为所有文件得分取均值。

二、浅显认识YOLO

(1)什么是YOLO和物体检测模型?

YOLO是一种流行的实时目标检测系统,其核心思想是将目标检测任务视为一个单一的回归问题,通过一个卷积神经网络(CNN)直接从图像像素到边界框坐标和类别概率的映射。该模型已经过多次迭代,引入了一些新的技术,如更深的网络结构、更好的锚框机制、多尺度特征融合等。

(2)YOLO模型需要什么训练格式?

YOLO使用的标注格式是每张图像一个文本文件,文件名与图像文件名相对应。文本文件中每一行对应一个边界框,格式为:<class> <x_center> <y_center> <width> <height>。其中,<class>是类别索引,<x_center><y_center>是边界框中心点相对于图像宽度和高度的比例,<width><height>是边界框的宽度和高度相对于图像宽度和高度的比例。

(3)如何训练YOLO模型?

使用Ultraalytics库,该库是一个提供多种计算机视觉模型的库,包括 YOLO 系列。

#Python

from ultralytics import YOLO 

# 设置模型版本 
model = YOLO("yolov8n.pt") 

# 设定数据集和训练参数 
results = model.train(data="yolo-dataset/yolo.yaml", epochs=2, imgsz=1080, batch=16)

 (4)如何对模型进行损失评估?

  • box_loss 是边界框回归损失,用于评估预测的边界框与真实边界框之间的差异。

  • cls_loss 是分类损失,用于评估类别预测的准确性。

  • dfl_loss 是防御性损失,用于提高模型的泛化能力。

三、运行结果截图

  • 4
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值