一.下载源码
在github中下载Yolov7源码并解压缩
YOLOv7 源码
数据标注可以参考这篇文章
https://blog.csdn.net/qq_39779449/article/details/110172948?spm=1001.2014.3001.5502
标签格式
二.配置环境
整体配置树结构
安装Yolo v7 gpu 环境
在Anconda中创造Yolov7环境
安装所需各种包
激活Yolov7环境 并安装Yolov7所需各种包,采用清华镜像源安装所需包(都试了一下,还是清华镜像更快)
activate yolov7
pip install -r F:\objectdet\yolov7-main/requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple
检查刚刚环境安装是否成功
如果完全按照requirements.txt来安装的话,你会发现安装的torch版本并不是gpu版本,所以得重新安装gpu版本的才能用你的gpu来训练Yolov7
pip install torch==1.8.2+cu111 torchvision==0.9.2+cu111 torchaudio===0.8.2 -f https://download.pytorch.org/whl/lts/1.8/torch_lts.html -i https://pypi.tuna.tsinghua.edu.cn/simple
安装好后,通过pip list查看你所安装的包,如下图所示,恭喜,安装成功
三.使Yolo v7 训练并测试自己的数据集
修改Yolo v7配置
在pycharm中选择刚刚安装好的Yolov7所需环境
修改配置环境
新建自己数据集的yaml文件
- train: 修改为自己的训练集路径
- val: 修改为自己的验证集路径
- test: 修改为自己的测试集路径
- nc: 修改为自己的数据集类别数量
- names: 修改为自己的数据集类别标签。
训练自己的数据集
通过pycharm训练,修改train.py文件如下,然后run
也可以通过下面方法直接在终端进行训练
python train.py --workers 1 --device 0 --batch-size 8 --data data/data.yaml --img 640 640 --cfg cfg/training/yolov7.yaml --weights '' --name yolov7 --hyp data/hyp.scratch.p5.yaml
如果出现以下界面,恭喜你,训练成功,慢慢的等你的模型训练完成吧
测试自己的数据集
在这里我们使用test.py文件中默认的参数
- data:更改为自己的数据集配置文件路径
- img:输入数据尺寸
- batch:批处理数据数量
- conf:置信度
- iou:阈值
- weights: 更改为自己的训练权重路径
- name:更改为自己的路径
python test.py --data data/data.yaml --img 640 --batch 8 --conf 0.001 --iou 0.65 --device 0 --weights yolov7.pt --name yolov7_val
对单张数据集进行预测
对单张图片进行预测
`
python detect.py --weights yolov7.pt --conf 0.25 --img-size 640 --source images/benign.jpg
四.遇到得问题及解决方案
不能跑yolov7-e6e.yaml文件
看官方论文,yolov7-e6e.yaml效果最好,于是打算试试yolov7-e6e.yaml,emmm,在对yolov7-e6e.yaml进行训练时,就报以下错误了。yolov7.yaml都可以正常运行,换成yolov7e6e.yaml就报错,nc已经改为我的数据集的类别了,做迁移学习是能用的。在网上查了一堆资料也没找到相关的解决方案。
最开始以为是显存不够,batch-size改为1,img-size改为128,可还是不行,查了一下作者的最新代码,发现yolov7-e6e.yaml与yolov7.yaml训练文件不一样。前者是通过train_aux.py进行训练,后者是通过train.py进行训练。
开始用train_aux.py开始进行训练,没错,又又报错了。。。解决了一个bug又出现另一个bug.
查看yolov7原作者的github issues部分,发现loss.py进行了修复,又将loss.py文件复制替换掉我的原loss文件,终于成功了。
总结:经验所得,以后跑大佬的代码。尽量还是用大佬的最新代码。可以少走很多弯路。