需要安装的东西(持续更新)
- anaconda(创建虚拟环境时注意选择python版本)
- yolov5以及requirements.txt中的依赖(直接安装不用选择版本)
- wandb(深度学习轻量级可视化工具入门教程)
- 标注软件(labelImg)
- 批量修改文件名(方便标注)
Anaconda
- 指令
activate yolo //打开名字叫yolo的虚拟环境
conda list //查看已安装包
- conda anaconda的区别/pip conda的区别
https://zhuanlan.zhihu.com/p/379321816
Pip可以在任何环境中安装包,但是只能安装Python包。
Conda只能在conda环境中安装包,但是可以安装各种语言、各种类型的包。
其实差不多。
Yolov5需要的标注文件格式
应该是txt,但是多种格式之间转换方式简单。
CUDA和CUDNN
有一种说法,CUDA和CUDNN主版本号一样就行。没试过
另一种,例如CUDA11.6,但是没有对应的CUDNN,那么可以使用cudnn for 11.x
CUDA版本问题
nvcc -V查看到的应该是支持的版本(或者驱动里查看到的)
nvidia-smi查看到的应该是已经安装的版本
一定要注意安装最新pytorch支持的最高版本的cuda,尽量不要去安装最新版本的cuda,要看pytorch支持到哪个版本。
但我在2022年3月份测试,我使用cuda11.6,cudnn for 11.x可以正常安装pytorch1.11(pytorch1.11官网上写着是支持cuda11.3)我猜测应该同属于一个大版本,pytorch和cuda都可以支持
pytorch在anaconda中的安装
去官网复制指令安装时,*千万不要用清华源!千万不要用清华源!千万不要用清华源!
一定要恢复默认源,并且挂梯子再安装pytorch。
原因是用官方命令安装pytorch会安装到清华源的默认cpu版本,自己手动下很麻烦,还是挂梯子吧
清华源害人不浅
注意,cmd命令窗口再挂梯子时要使用命令set http_proxy=http://192.168.2.179:7890(ip和端口换成你自己的)(同下)
这个命令是关了窗口就会失效的。
训练时
使用wandb可视化
注意使用全局梯子,cmd也要挂上代理。具体方法见此处https://blog.csdn.net/qiphon3650/article/details/111060707
set http_proxy=http://127.0.0.1:1080
set https_proxy=http://127.0.0.1:1080
set http_proxy_user=user
set http_proxy_pass=pass
set https_proxy_user=user
set https_proxy_pass=pass
# 恢复
set http_proxy=
set https_proxy=
# linux 下命令为 export, 很相似
# export http_proxy=http://127.0.0.1:1080
其他问题的解决
https://blog.csdn.net/peacefairy/article/details/110528012
步骤总结
- 标注数据 准备好训练集和测试集
- 训练集与label放到yolomaster中,配置yaml文件
- 启动anaconda
- 挂梯子,set proxy
- 修改train.py参数
- 训练