YOLOV5s 训练问题总结

问题1:训练出现检测结果和标签不对应

解决说明:数据配置文件data.yaml文件中参数分类要根据yolo中0,1,2顺序排序!!例如:0:kp 1:hh 2:qk

问题2:运行yolov5 train.py报错:AssertionError: Image Not Found …/data/images/xxx.png

解决说明:需将之前在本机或服务器端训练生成的.cache文件删除,重新在电脑或服务器上运行train.py即可

实际操作:在存放标签的目录下,删除train.cache和val.cache后再重新在自己电脑或者服务器上运行即可

问题3PermissionError: [Errno 13] Permission denied

解决说明:是文件无法打开,可能产生的原因是文件找不到,或者被占用,或者无权限访问,或者打开的不是文件,而是一个目录

实际操作:sudo chmod 777 filename

filename换成你需要解锁的文件即可,例如:sudo chmod 777 main.cpp.那么被锁的main.cpp文件就解锁了。但是要注意,这种方法如果是一个文件夹,那么这个大的文件夹是解锁了,里面的一些小的文件或是文件夹还是上锁的,但是可以单独对这个大的文件夹操作了,比如增删之类的。

对于整个文件的解锁:

实际操作:sudo chown -R username filename

username就是你Ubuntu系统安装的时候取得名字,filename就是被锁文件夹名字。

例如 sudo chown -R coco libbpf 这个时候libbpf文件夹就被解锁而且里面的内容都不会被锁,也就是相当于是全部解锁。

————————————————
版权声明:本文为CSDN博主「木可木可❀」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/weixin_44260459/article/details/122713532

问题4对于服务器单击多卡训练问题

单击多卡命令

$  python -m torch.distributed.launch --nproc_per_node 2 train.py --batch 32 --data data/AKD1.yaml --weights weights/yolov5s.pt --device 0,1

–nproc_per_node: 指定多少GPU要被使用。
–batch-size:这里是总的大小,多个GPU这个值将被均分,比如以上示例有2个GPU,那每个GPU batch-size为32/2=16

注意:一定要对应文件路径,有的博客写的是直接pt文件或者yaml文件,我这边会报错改为路径就好了

1.可以选择在pycharm的终端上进行输入

2.可以选择直接在系统terminal终端输入,但是要先cd 到项目的文件夹里面不然会报错!

    

  • 3
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值