语义分割——YOLOv8-Seg【train】【predict】参数汇总与调参建议

目录

语义分割——YOLOv8-Seg 参数汇总与调参建议

train 参数

参数默认值说明调参建议
modelNone模型文件的路径,如 yolov8m.pt-
dataNone数据文件的路径,如 coco128.yaml-
epochs100训练周期根据数据集大小和模型复杂度调整
timeNone训练的小时数,如果已提供,则覆盖epochs如果有时间限制,可设置该参数
patience50在没有明显改善的情况下,提前停止训练的等待时间根据训练过程中的收敛情况调整
batch16每批图像数(-1 表示自动批次)根据 GPU 内存大小调整
imgsz640输入图像尺寸根据数据集图像大小和硬件限制(如 GPU 内存)调整
saveTrue是否 保存训练 checkpoint预测结果-
save_period-1每 x 周期保存一次 checkpoint(如果 < 1 则禁用)-
cacheFalse是否 使用缓存加载数据根据数据集大小和加载速度决定
deviceNone运行设备,如device = 0device = cpu根据硬件资源分配合适的设备
workers8加载数据的工作线程数根据系统资源和数据集大小调整
projectNone项目名称-
nameNone实验名称-
exist_okFalse是否 覆盖现有实验-
pretrainedTrue使用预训练模型 还是 使用模型加载权重-
optimizerauto使用的 优化器,选择 = [SGD、Adam、Adamax、AdamW、NAdam、RAdam、RMSProp、auto]auto表示系统自动动态选择优化器)根据模型和数据选择最优优化器
verboseFalse是否 打印详细输出-
seed0随机种子设置种子以保证实验可重复性
deterministicTrue是否 启用确定性模式需要确保结果一致性时启用
single_clsFalse是否 将多类别数据当作单一类别训练单类别训练场景中启用
rectFalse矩形训练,每批都经过整理,以减少填充物-
cos_lrFalse是否 使用余弦学习率调度器有助于细致调整模型参数,适用于长周期训练
close_mosaic10最后 x 个周期 禁用 mosaic 数据增强根据训练进展调整增强策略(参考:数据增强之 Mosaic - 知乎 (zhihu.com)
resumeFalse是否 从上一个 checkpoint 恢复训练-
ampTrue是否 使用自动混合精度(AMP)训练在硬件支持的情况下启用以提高训练效率(利用半精度浮点数加速训练过程,可以减少显存占用)
fraction1.0训练集使用的数据比例-
profileFalse训练期间是否 分析 ONNX 和 TensorRT 速度-
freezeNone在训练过程中 冻结前 n 层,或冻结层索引列表迁移学习场景中冻结特定层
lr00.01初始学习率根据模型和数据集大小调整
lrf0.01最终学习率根据训练策略调整
momentum0.937SGD 动量 / Adam 的 beta1根据优化器类型和训练过程调整
weight_decay0.0005优化器权重衰减防止过拟合时调整,过大会导致欠拟合
warmup_epochs3.0预热周期数(可以是分数)根据模型和数据集调整热身期
warmup_momentum0.8预热初始动量在预热时调整动量以稳定训练
warmup_bias_lr0.1预热偏置的学习率在预热时适当提高偏置项的学习率
box7.5边框损失增益(值越大越表强调)根据训练输出的box_loss调整
cls0.5类别损失增益(值越大越表强调,按像素缩放)根据训练输出的cls_loss调整
dfl1.5DFL 损失增益根据训练输出的dfl_loss调整
pose12.0姿态损失增益(仅 pose 训练)-
kobj2.0关键点对象损失增益(仅 pose 训练)-
label_smoothing0.0标签平滑,一种正则化技术,用于减少模型对训练数据的过拟合程度在多类别分类中使用以提高整体泛化性,通常取0.1,过大会导致欠拟合
nbs64标称批量,训练过程中每个批次的大小根据 GPU 内存和模型大小调整
overlap_maskTrue是否 遮罩应在训练期间重叠(仅 seg 训练)-
mask_ratio4mask 降采样比率(仅 seg 训练,mask 的尺寸将缩小为原来的 1/x)-
dropout0.0使用 dropout 正则化(仅 cls 训练)如果设置为非零值,则在训练过程中使用丢弃正则化来 减少模型的过拟合
valTrue是否 在训练期间验证/测试-
plotsFalse是否 在训练/评估过程中保存绘图和图像-

predict 参数

参数默认值说明调参建议
sourceultralytics/assets图片或视频的源目录-
conf0.25用于检测的 对象置信阈值,只有置信度高于此阈值的对象才会被检测出来根据训练结果的F1_curve.png调整
iou0.7非极大值抑制(NMS)的交并比(IoU)阈值用于去除重叠的检测框,只保留具有最高置信度的框
imgsz640输入图像尺寸根据数据集图像大小和硬件限制(如 GPU 内存)调整
halfFalse使用 半精度(FP16)半精度可以减少计算量,但可能会牺牲一些精度
deviceNone运行设备,如device = 0device = cpu根据硬件资源分配合适的设备
max_det300每个图像的最大检测数根据实际应用场景和性能需求调整
vid_strideFalse视频帧率步长根据需要调整视频处理的帧率
stream_bufferFalse缓冲所有流帧True)或 返回最近的帧False根据实时处理需求和资源限制调整
visualizeFalse是否 可视化模型特征-
augmentFalse是否 对预测源应用图像增强-
agnostic_nmsFalse是否使用 类别不可知(无关)的非极大值抑制(NMS)在检测不区分类别的应用场景中启用
classesNone按类别筛选结果,即classes = 0classes = [0,2,3]-
retina_masksFalse是否使用 高分辨率的分割掩膜在进行高精度分割任务时启用
embedNone返回给定层的特征向量/嵌入-
showFalse如果环境允许,是否 显示预测的图像和视频-
saveFalse是否 保存 预测的 图像和视频-
save_framesFalse是否 保存 预测的 单个视频帧-
save_txtFalse是否将 结果保存为 .txt 文件-
save_confFalse是否将 检测结果与置信度分数一起保存-
save_cropFalse是否 保存裁剪的图像与结果-
show_labelsTrue是否 显示预测标签-
show_confTrue是否 显示预测置信度-
show_boxesTrue是否 显示预测边界框-
line_widthNoneorint边界框的线宽(如果为None,则缩放为图像大小)根据可视化需求和图像大小调整
  • 29
    点赞
  • 32
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值