DataWhale AI夏令营 CV方向 Task3 上分思路
上分思路
1 上分点一:数据集增强
常见的增强技术包括翻转、旋转、缩放和颜色调整。多个库,例如 Albumentations、Imgaug 和 TensorFlow的 ImageDataGenerator,可以生成这些增强。
本次训练通过调整设置模型训练时的参数为
mixup=0.4, copy_paste=0.5, mosaic=0
mixup: 混合增强的比例,这里设置为0.4,意味着在训练过程中有40%的概率对每个批次应用mixup数据增强,mixup通过线性插值将两个图像及其标签混合在一起。
copy_paste: 复制粘贴增强的比例,这里设置为0.5,意味着在训练过程中有50%的概率对每个批次应用copy paste数据增强,copy paste将图像的一部分复制并粘贴到另一张图像上。
mosaic: 马赛克增强的比例,这里设置为0,意味着在训练过程中不应用mosaic数据增强,mosaic增强是将四张图像拼接成一张新的训练图像。
2 上分点二:设置 YOLO 模型训练参数
YOLO 模型的训练设置包括多种超参数和配置,这些设置会影响模型的性能、速度和准确性。微调涉及采用预先训练的模型并调整其参数以提高特定任务或数据集的性能。该过程也称为模型再训练,使模型能够更好地理解和预测在实际应用中将遇到的特定数据的结果。可以根据模型评估重新训练模型,以获得最佳结果。
3 上分点三:设置 YOLO 模型预测行为和性能
YOLOv8模型的使用者提供了灵活性,允许根据特定应用场景的需求调整模型的行为和性能。例如,如果需要减少误报,可以提高conf阈值;如果需要提高模型的执行速度,可以在支持的硬件上使用half精度;如果需要处理视频数据并希望加快处理速度,可以调整vid_stride来跳过某些帧。这些参数的适当配置对于优化模型的预测性能至关重要。
将预测模型的参数进行设置:
conf=0.90,augment=True
conf: 置信度阈值,用于设置检测对象的最小置信度。低于此阈值的检测对象将被忽略。调整此值有助于减少误报。
启用预测时的数据增强(TTA),可能通过牺牲推理速度来提高检测的鲁棒性。
最终结果从上一轮的0.04提高到0.059,提升很微弱,正在思考采用其他网络模型或对数据集进一步处理。