一、准备数据集
1.数据收集:去网上收集包含兔子的500张图像数据集,并确保它们涵盖了各种场景、角度和兔子姿势,而且要求一张图片中要包含多个兔子,确保后续代码运行时兔子特征数量够。
ps:注意一点是收集的图片格式必须是JPG格式或者JPEG格式,保存成其他格式的图片在后面运行都不成功,所以第一步收集数据是非常重要的!
2.数据标注:使用图像标注工具(LabelImg)对图像进行标注,标注出兔子的位置和类别,并生成YOLO格式的标注文件(.xml),生成的标注文件要放在自己新建的一个文件夹里面。
二、数据预处理
划分数据集为训练集和测试集,并创建相应的.txt文件列出图像的路径。
三、配置训练
根据提供的YOLO4代码配置好相关环境和相关库,在配置文件中指定训练集、验证集和标注文件的路径。
四、开始训练
1.先运行YOLO4代码里面的voc_annotation代码文件,得出下面的结果图,可以看出结果图里面的720代表着全面收集的数据集里面有多少的兔子标签。
2.再运行YOLO4的train代码文件,会出现进度条,然后会出现一条代码:“save best model to best_epoch_weights.path”,这个代码在后面测试与评估改路径是会用到,需要提前复制下来。在训练过程中,根据需要其他超参数,让运行的次数更快一些。
五、测试与评估
前面的准备工作已经完成,最后一步就是运行predict代码文件,里面代码与前面运行相关的就是要改成训练集和测试集运行出来的txt文件路径,不然运行出来的结果出现的标签并不是自己新建的文件里面所含吧标签,会导致结果运输的错误。
六、优化与调整
根据测试结果和需求,对模型进行优化和调整,可能需要多次训练和调参。为了让代码识别框图片更加准确,就要对yolo代码文件里面的confidence数值进行修改,对不同的兔子图像进行试验,直到可以准确框出兔子和给出框的位置,这样才是完美的结果。