Datawhale AI 夏令营 CV方向 Task 3

2301_81185698

于 2024-08-31 14:33:27 发布

阅读量174

点赞数 4

文章标签：人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/2301_81185698/article/details/141752231

版权

数据集增强

在机器学习中，数据集是极为关键的材料。因此提供更为干净的数据和训练样本能够更好的提高模型的泛化能力。常见的增强技术包括翻转、旋转、缩放和颜色调整，有许多库能够生成增强数据。

如下是一些图片进行数据增强后的结果

二、设置YOLO模型训练参数

YOLO模型中存在着许多参数以及超参数，这些参数与模型的速度、准确性、性能息息相关。通过调整模型部分参数，不断微调，不断训练，不断评估模型性能，从而达到最好的效果。

以下是一些基本参数的含义：

imgsz: 训练时的目标图像尺寸，所有图像在此尺寸下缩放。
save_period: 保存模型检查点的频率（周期数），-1 表示禁用。
device: 用于训练的计算设备，可以是单个或多个 GPU，CPU 或苹果硅的 MPS。
optimizer: 训练中使用的优化器，如 SGD、Adam 等，或 'auto' 以根据模型配置自动选择。
momentum: SGD 的动量因子或 Adam 优化器的 beta1。
weight_decay: L2 正则化项。
warmup_epochs: 学习率预热的周期数。
warmup_momentum: 预热阶段的初始动量。
warmup_bias_lr: 预热阶段偏置参数的学习率。
box: 边界框损失在损失函数中的权重。
cls: 分类损失在总损失函数中的权重。
dfl: 分布焦点损失的权重。

三、设置 YOLO 模型预测行为和性能

YOLO模型的预测结果通常包括多个组成部分，每个部分提供关于检测到的对象的不同信息。同时 YOLO 能够处理包括单独图像、图像集合、视频文件或实时视频流在内的多种数据源，也能够一次性处理多个图像或视频帧，进一步提高推理速度。

属性	描述
cls	类别概率，表示当前预测结果属于类别0的概率为0。
conf	置信度，模型对其预测结果的置信度，接近92%。
data	包含边界框坐标和置信度以及类别概率的原始数据。
id	没有分配唯一的对象ID。
is_track	预测结果不是来自跟踪的对象。
orig_shape	输入图像的原始尺寸，这里是500x500像素。
shape	预测结果张量的形状，表示一个边界框的六个值。
xywh	归一化的边界框坐标，中心坐标和宽高。
xywhn	归一化的边界框坐标（无偏移）。
xyxy	原始边界框坐标，左上角和右下角坐标。
xyxyn	归一化的原始边界框坐标。

关注

4
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
Datawhale AI 夏令营 CV方向 Task 3

在机器学习中，数据集是极为关键的材料。因此提供更为干净的数据和训练样本能够更好的提高模型的泛化能力。常见的增强技术包括翻转、旋转、缩放和颜色调整，有许多库能够生成增强数据。如下是一些图片进行数据增强后的结果。
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。