先来说下笔者的环境:
nvidia 2070s -cuda11.6-driver version 581.xx
python版本3.8
写在最前面!!!!!!!!!!!!!!!!!!!!!!!!!!!!
一定要按照根目录下的requirements来安装依赖库,而不是自己想装什么版本就是什么版本
教程:
conda activate 你的虚拟环境名称
输入指令:pip install -r 输入你的requirements.txt文本的位置(不需要区分正反斜杠)\requirements.txt(笔者用了科网,如果没有的话,请换清华源,百度即可)
等待安装好后,关闭prompt,重启pycharm,更换interpreter为你的环境
一般路径为:
你的盘符:Anaconda\envs\你的虚拟环境名\python.exe
一、train.py切换GPU模式
找到
parser.add_argument('--device', default='', help='cuda device, i.e. 0 or 0,1,2,3 or cpu')
default改为0
二、如果发现切换为GPU模式后报错invalid
随便创建一个py文件,输入
import torch print(torch.cuda.is_available())
如果返回False,请在conda内连接当前虚拟环境,输入
pip uninstall torch
pip uninstall torchverison
按照提示一步一步来,
完成后在cmd中输入nvcc --version
此时cuda compilation后release才是真实版本,用nvidia-smi和控制面板中看到的 都是支持的最大版本,而不是当前版!!!
在PyTorch 官网中,找到对应版本,pip安装。
重启即可。
三、database not found
如果发现这个问题,需查看你的yaml文件,注意!!python中是无法识别"\"的,要把里面的'\"全部替换成"/"
四、cannot train without labels.
说一个比较蠢的错误:
在创建images和labels文件时,labels一定是labels而不是"label"
images里面存放的是train和val两个文件,这里面都!!都!!都!!要装图片!!图片!!图片!!而不是val里面装txt文本
txt文本要装在labels的train里!!
五、cannot train without labels
先删除你创建的存放dataset的文件夹下labels文件下的cache文件
之后检查一下第四条,看一下自己的文件是不是装错位置了
六、若出现yolov5 OSError : raise err[WinError 1455] 页面文件太小,无法完成操作。