问题1:训练出现检测结果和标签不对应
解决说明:数据配置文件data.yaml文件中参数分类要根据yolo中0,1,2顺序排序!!例如:0:kp 1:hh 2:qk
问题2:运行yolov5 train.py报错:AssertionError: Image Not Found …/data/images/xxx.png
解决说明:需将之前在本机或服务器端训练生成的.cache文件删除,重新在电脑或服务器上运行train.py即可
实际操作:在存放标签的目录下,删除train.cache和val.cache后再重新在自己电脑或者服务器上运行即可
问题3:PermissionError: [Errno 13] Permission denied
解决说明:是文件无法打开,可能产生的原因是文件找不到,或者被占用,或者无权限访问,或者打开的不是文件,而是一个目录
实际操作:sudo chmod 777 filename
filename换成你需要解锁的文件即可,例如:sudo chmod 777 main.cpp.那么被锁的main.cpp文件就解锁了。但是要注意,这种方法如果是一个文件夹,那么这个大的文件夹是解锁了,里面的一些小的文件或是文件夹还是上锁的,但是可以单独对这个大的文件夹操作了,比如增删之类的。
对于整个文件的解锁:
实际操作:sudo chown -R username filename
username就是你Ubuntu系统安装的时候取得名字,filename就是被锁文件夹名字。
例如 sudo chown -R coco libbpf 这个时候libbpf文件夹就被解锁而且里面的内容都不会被锁,也就是相当于是全部解锁。
————————————————
版权声明:本文为CSDN博主「木可木可❀」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/weixin_44260459/article/details/122713532
问题4:对于服务器单击多卡训练问题
单击多卡命令
$ python -m torch.distributed.launch --nproc_per_node 2 train.py --batch 32 --data data/AKD1.yaml --weights weights/yolov5s.pt --device 0,1
–nproc_per_node: 指定多少GPU要被使用。
–batch-size:这里是总的大小,多个GPU这个值将被均分,比如以上示例有2个GPU,那每个GPU batch-size为32/2=16
注意:一定要对应文件路径,有的博客写的是直接pt文件或者yaml文件,我这边会报错改为路径就好了
1.可以选择在pycharm的终端上进行输入
2.可以选择直接在系统terminal终端输入,但是要先cd 到项目的文件夹里面不然会报错!