城市管理违规行为智能识别_Task2学习心得

1、目标检测:

输入通常为图片或视频帧

通常使用CNN作为特征提取器

在two-stage算法中,使用R-CNN(基于区域的卷积神经网络),先生成候选区域

对每个候选区域,需要判断物体类别(分类)和边界框(回归)

在检测过程中,一个物体可能得出多个框,这时需要非极大值抑制

One-stage模型:

直接在单次网络评估得出物体的类别和边界框,速度快但是精度较低

Two-Stage模型:

先用区域提议网络生成候选区域,再对区域进行分类和边界框的精调,精度高速度慢

2、YOLO模型学习:

YOLO是一种经典的One-Stage模型

使用CNN来提取图像特征

Yolo对每个边界框预测一个置信度=Pr(Object) * IOU(pred, truth);Pr代表格子中存在目标的概率,IOU代表交并比

自2015年以来每年迭代一个版本,目前已经是v10了

数据格式:每个图像使用一个txt文件标注,包括:1)类别:一个整数;2)边界坐标:由(x_center, y_center)和宽度width、高度height组成,其中(x_center, y_center)为边界框中心坐标

3、baseline调参:

在讲义里面给出的调参是增加训练集、切换不同模型权重。我选用的是参数量最大的yolov8x,选用了较大的模型就要把batchsize调低一点,我设置的batchsize是8,在默认16的情况下会Out of memory。总的来说本次学习还是比较简单的。

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值