环境安装
-
Anaconda
-
可使用gpu,运行python脚本
-
-
pytorch
-
官网有安装命令行,已经做好了版本号匹配的。
-
-
cuba
-
在控制面板里查看版本号后去官网下载,向下兼容的,比如自己的cuda是12.2,用11.7也是ok的。这里建议不要下最高最新版,下载大家用的比较多的稳定版最好,出问题了教程也多。
-
-
cudnn
-
写可执行程序去推理onnx需要用到这个运行库,如果只是用python pytorh则用不到这个。
-
-
数据标注软件
-
labelimg
-
标注信息默认txt格式,这种格式可直接用于训练。
-
-
anylabeling
-
标注信息默认json格式,需要转换成txt,才能训练。
-
工具内可直接预测推导,比如在功能里选择yolov7模型,可帮助我们快速标记。
-
-
训练
- train.py 在Anaconda里执行才能用GPU资源。
- P/R值
- P/R值超低,甚至经常是0。
- 数据是否有误,检查runs/trains下生成的训练测试图jpg是否符合预期,检查标签与框框位置。
- 训练轮次不够,提升轮次,默认轮次300轮,训练图的特征差异大,不够典型,不充分,可能在训练50轮次以内,都看不到好的效果。
- P/R值 持续为Nan/0
- 检查运行环境。
- 按照官方提示的pytorch安装指引来,版本号要对应。
- P/R值超低,甚至经常是0。
- 标签平衡
- v7已经有自动平衡标签能力,但还是尽量保障每个标签提供的训练图足够多样和充分。
- 常规常见下,是需要使用init weight,这样训练的效果好,因为已经有了权重。
推理预测:
- 计算效率 tensorrt>onnx,提速可以尝试tensorrt。
- onnx检查依赖环境,onnx-runtime、cudnn。
dll依赖:
- 会报错“onnxruntime_providers_cuda.dll”
- 众多dll被依赖,这些dll可以手动全部放在exe目录下,也可以直接将目录设置到系统环境变量,每次修改环节变量,都需要重启进程,比如cmd要重启,VS也要重启。
- C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.7\bin
- C:\Program Files\NVIDIA\CUDNN\v9.0\bin\11.8
- cudnn也要注意版本号,比如有些onnx依赖的是cudnn-8,就必须给他用8版本的cudnn。
#windows上调用cuda去 使用GPU来进行预测
-需要下载cudnn,cuDNN 9.0.0 Downloads | NVIDIA Developer
-环境变量要配置
比如 :
也可以尝试把这些dll放在程序目录下
否则,可能会遇到 load library的错误。
LoadLibrary failed with error 126 "" when trying to load "onnxruntime_providers_cuda.dll"