# Ultralytics YOLO 🚀, AGPL-3.0 许可证 # 对于中等增强的 COCO 训练,默认的训练设置和超参数 # YOLO 任务设置,指定要执行的任务类型 task: detect # (str) YOLO 任务类型,例如:detect(检测)、segment(分割)、classify(分类)、pose(姿态) # YOLO 模式设置,确定操作模式 mode: train # (str) YOLO 操作模式,例如:train(训练)、val(验证)、predict(预测)、export(导出)、track(跟踪)、benchmark(基准测试) # 设置训练参数 ------------------------------------------------------------------------------------------------------- model: # (字符串, 可选) 模型文件路径,例如 yolov8n.pt 或 yolov8n.yaml data: # (字符串, 可选) 数据集配置文件路径,例如 coco128.yaml epochs: 100 # (整数) 训练轮次数量 patience: 0 # (整数) 早停,无明显改进时提前停止训练前等待的轮次数量, batch: 4 # (整数) 每批图像的数量 (-1 表示自动批量) imgsz: 640 # (整数 | 列表) 输入图像大小,作为整数用于训练和验证模式,或列表[w,h]用于预测和导出模式 save: True # (布尔) 是否保存训练检查点和预测结果 save_period: -1 # (整数) 每 x 轮次保存一次检查点(如果小于 1 则禁用) cache: False # (布尔) 使用内存缓存、磁盘缓存或禁用缓存进行数据加载 device: # (整数 | 字符串 | 列表, 可选) 运行设备,例如 CUDA device=0 或 device=0,1,2,3 或 device=cpu workers: 0 # (整数) 数据加载的工作线程数量(如果使用DDP则为每个RANK的数量) project: runs/train # (字符串, 可选) 项目名称 name: exp # (字符串, 可选) 实验名称,结果保存到 'project/name' 目录 exist_ok: False # (布尔) 是否允许覆盖已存在的实验 pretrained: True # (布尔 | 字符串) 是否使用预训练模型(布尔值)或加载权重的模型(字符串) optimizer: AdamW # (字符串) 使用的优化器,可选 [SGD, Adam, Adamax, AdamW, NAdam, RAdam, RMSProp, auto] verbose: True # (布尔) 是否打印详细输出 seed: 0 # (整数) 用于复现性的随机种子 deterministic: True # (布尔) 是否启用确定性模式 single_cls: False # (布尔) 将多类别数据作为单一类别训练 rect: False # (布尔) 在训练模式下使用矩形训练或在验证模式下使用矩形验证 cos_lr: False # (布尔) 是否使用余弦学习率调度器 close_mosaic: 0 # (整数) 最后几轮禁用马赛克增强(0 表示不禁用) resume: False # (布尔) 从最后一个检查点恢复训练 amp: False # (布尔) 自动混合精度 (AMP) 训练,可选 [True, False],True 表示运行 AMP 检查 fraction: 1.0 # (浮点数) 训练数据集的比例(默认为 1.0,表示所有训练集中的图像) profile: False # (布尔) 在训练过程中为记录器分析 ONNX 和 TensorRT 的速度 freeze: None # (整数 | 列表, 可选) 冻结前 n 层,或冻结训练期间的层索引列表 # 分割设置 overlap_mask: True # (布尔) 训练期间掩码是否应重叠(仅适用于分割训练) mask_ratio: 4 # (整数) 掩码下采样比例(仅适用于分割训练) # 分类设置 dropout: 0.0 # (浮点数) 使用丢弃正则化(仅适用于分类训练) # Val/Test 设置 ----------------------------------------------------------------------------------------- val: True # 是否在训练过程中进行验证/测试 split: val # 用于验证的数据集划分,例如 'val'、'test' 或 'train' save_json: False # 是否将结果保存到 JSON 文件 save_hybrid: False # 是否保存混合版本的标签(标签 + 额外预测) conf: # 目标检测时的对象置信度阈值(默认预测时为 0.25,验证时为 0.001) iou: 0.7 # 非极大值抑制 (NMS) 的交并比 (IoU) 阈值 max_det: 300 # 每张图像的最大检测数 half: False # 是否使用半精度 (FP16) dnn: False # 是否使用 OpenCV DNN 进行 ONNX 推理 plots: True # 训练/验证期间是否保存图表 # 设置预测相关的配置 ------------------------------------------------------------------------------------ source: # 源目录,用于指定图像或视频的来源 show: False # 是否显示结果(如果可能的话) save_txt: False # 是否保存结果为 .txt 文件 save_conf: False # 是否保存结果时附带置信度分数 save_crop: False # 是否保存带有结果的裁剪图像 show_labels: True # 是否在图表中显示对象标签 show_conf: True # 是否在图表中显示对象的置信度分数 vid_stride: 1 # 视频帧率步长 stream_buffer: False # 是否缓冲所有流式传输的帧(True)或仅返回最近的一帧(False) line_width: # 边界框的线宽,如果缺失则自动确定 visualize: False # 是否可视化模型特征 augment: False # 是否对预测源应用图像增强 agnostic_nms: False # 是否使用类别不可知的非极大值抑制(NMS) classes: # 类别过滤,可以指定一个类别或类别列表,例如 classes=0 或 classes=[0,2,3] retina_masks: False # 是否使用高分辨率的分割掩模 boxes: True # 在分割预测中是否显示边界框 # 导出设置 ------------------------------------------------------------------------------------------------------ format: torchscript # (str) 要导出的格式,可选项参见 https://docs.ultralytics.com/modes/export/#export-formats keras: False # (bool) 是否使用 Keras optimize: False # (bool) TorchScript: 是否针对移动端进行优化 int8: False # (bool) CoreML/TF INT8 量化 dynamic: False # (bool) ONNX/TF/TensorRT: 是否启用动态轴 simplify: False # (bool) ONNX: 是否简化模型 opset: # (int, 可选) ONNX: 指定操作集版本 workspace: 4 # (int) TensorRT: 工作区大小 (GB) nms: False # (bool) CoreML: 是否添加 NMS (非最大值抑制) # 超参数配置 ----------------------------------------------------------------------------------- # 学习率相关 lr0: 0.0001 # 初始学习率,例如 SGD 通常为 1E-2,Adam 通常为 1E-3。 lrf: 1.0 # 最终学习率,计算方式为初始学习率乘以此值。 # 优化器相关 momentum: 0.9 # SGD 动量或 Adam 的 beta1 参数。 weight_decay: 0.0001 # 优化器权重衰减,通常为 5e-4。 # 预热阶段 warmup_epochs: 2000 # 预热迭代次数,可以使用小数表示。 warmup_momentum: 0.8 # 预热初始动量。 warmup_bias_lr: 0.1 # 预热初始偏置学习率。 # 损失函数增益 box: 7.5 # 盒子损失增益。 cls: 0.5 # 分类损失增益,按像素缩放。 dfl: 1.5 # 分布焦点损失增益。 pose: 12.0 # 姿态损失增益。 kobj: 1.0 # 关键点目标损失增益。 # 标签平滑 label_smoothing: 0.0 # 标签平滑系数。 # 名义批次大小 nbs: 64 # 名义上的批次大小。 # 图像增强 hsv_h: 0.015 # 图像 HSV 色调增强比例。 hsv_s: 0.7 # 图像 HSV 饱和度增强比例。 hsv_v: 0.4 # 图像 HSV 明度增强比例。 degrees: 0.0 # 图像旋转角度。 translate: 0.1 # 图像平移比例。 scale: 0.5 # 图像缩放比例。 shear: 0.0 # 图像剪切角度。 perspective: 0.0 # 图像透视变换比例,范围 0-0.001。 # 数据增强概率 flipud: 0.0 # 图像上下翻转的概率。 fliplr: 0.5 # 图像左右翻转的概率。 mosaic: 0.0 # 使用马赛克数据增强的概率。 mixup: 0.0 # 使用 MixUp 数据增强的概率。 copy_paste: 0.0 # 使用复制粘贴数据增强的概率。 # 自定义配置文件 --------------------------------------------------------------------------------------------------- cfg: # (str, optional) 用于覆盖默认配置文件defaults.yaml的某些设置 # 跟踪器设置 ---------------------------------------------------------------------------------------------------------- tracker: botsort.yaml # (str) 指定跟踪器类型,可选值包括botsort.yaml和bytetrack.yaml
RT-DETR yaml 配置文件说明
最新推荐文章于 2024-10-11 08:21:01 发布