DataWhale AI夏令营 CV方向 Task2
Baseline 进阶思路
1 数据集
在baseline的代码基础上要提高识别准确率,首先可以增大训练集,增加更多的视频进行训练,第一次增大到10个视频进行训练,第二轮增大到30个视频进行训练。
2 更换基础模型
baseline中采用的模型为yolov8n,可以采用同系列更大尺寸的模型yolov8m,yolov8x,yolov8l等模型,第一轮训练采用yolov8m模型,第二轮采用yolov8l模型
3 增加训练轮数
从baseline的2轮训练增加到10轮训练,第二次增加至20轮训练
4 改动batchsize
-
批处理大小过大:
优点:
训练速度较快:大批次可以充分利用硬件加速器(如GPU)的并行计算能力,加速训练过程。
确保收敛性:大批次可以更好地平均梯度,减少梯度更新的噪声,可能有助于收敛到较好的局部最小值。
缺点:
内存需求高:较大的批次需要更多的内存空间,如果系统资源受限,可能会导致内存不足。
泛化性能下降:较大的批次可能会导致模型过度拟合训练数据,使其泛化能力下降,对于验证集或测试集的泛化效果可能较差。 -
批处理大小过小:
优点:
内存消耗少:小批次需要较少的内存,适合在资源有限的设备上进行训练。
更好的泛化性能:小批次可能有助于模型更好地泛化到验证集或测试集,减少过度拟合的风险。
缺点:
训练速度较慢:小批次可能无法充分利用硬件加速器的并行计算能力,导致训练速度变慢。
不稳定的梯度更新:小批次可能使得梯度估计不准确,导致训练过程中的不稳定性和收敛速度较慢。
最终结果从baseline的0.004提高到0.04,提高了10倍,新一轮训练正在进行中。