训练DAMO-YOLO（damoyolo_tinynasL25_S.py）

孟孟单单

已于 2024-01-15 10:14:00 修改

阅读量1.8k

点赞数 31

分类专栏：深度学习项目经验tips 文章标签： YOLO

于 2024-01-14 20:24:39 首次发布

本文链接：https://blog.csdn.net/lwd19981223/article/details/135567771

版权

深度学习项目经验tips 专栏收录该内容

40 篇文章 11 订阅

订阅专栏

文章目录

参考链接
1 准备数据
- 1.1 转为COCO格式
- 1.2 指明数据路径
2 设置训练配置文件，在configs/damoyolo_tinynasL25_S.py进行如下两块修改
- 2.1 关于训练参数的设置
- 2.2 根据自己数据集设置
3 开始训练
4 调用tools/eval.py进行测试
5 训练时可能遇到的报错
- 5.1 RuntimeError: Distributed package doesn't have NCCL built in
- 5.2 ModuleNotFoundError: No module named 'damo.base_models.core'

参考链接

官方代码：DAMO-YOLO
DAMO-YOLO最强操作教程.我的这博文不算很详细，可以去看看这篇博文的视频链接。但我的博文也就是少了配置虚拟环境的步骤，其实如果已经配置好了YOLO相关的虚拟环境，跟着我来应该是能跑通的

1 准备数据

1.1 转为COCO格式

参考我的另一篇博客：将YOLO数据集转成COCO格式，单个文件夹转为单个json文件，例如…/images/train转为instance_train.json

1.2 指明数据路径

在damo/config/paths_catalog.py进行修改

在这里插入图片描述

2 设置训练配置文件，在configs/damoyolo_tinynasL25_S.py进行如下两块修改

在configs/damoyolo_tinynasL25_S.py进行如下两块修改

2.1 关于训练参数的设置

右侧的base.py在damo/config/base.py

在这里插入图片描述

        self.train.batch_size = 2   # 训练时的batchsize
        self.train.total_epochs = 300   # 训练的总轮数
        # self.train.finetune_path = ''   # 如果要加上预训练权重，就下载了然后指明位置
        self.test.batch_size = 4    # 是训练时候的2倍，但是我在想在训练完之后进行测试时，是不是应该改为1
        self.miscs.num_workers = 0  # windows下设置为0
        self.miscs.output_dir = './workdirs'    # 训练完后保存的目录
        self.miscs.exp_name = 'DAMO-YOLOs'      # 自定义文件名

2.2 根据自己数据集设置

在这里插入图片描述

3 开始训练

python -m torch.distributed.launch --nproc_per_node=1 tools/train.py -f configs/damoyolo_tinynasL25_S.py

可以像下图一样，直接设置好配置文件的绝对路径，肯定不会出现找不到配置文件的错误

在这里插入图片描述

这个-m torch.distributed.launch --nproc_per_node=1是用来设置多卡训练的，必须要带上才能正常运行起来，因此我在调试的时候多有不便，亲测这个博客很有用，如果有需要可以参考：Pycharm 调试debug torch.distributed.launch
- 兴许这个博客也能有用，暂存一下：DAMOYOLO windows 单卡训练

4 调用tools/eval.py进行测试

官方示例：

python -m torch.distributed.launch --nproc_per_node=1 tools/eval.py -f configs/damoyolo_tinynasL25_S.py --ckpt /path/to/your/damoyolo_tinynasL25_S.pth

感觉DAMO-YOLO跟YOLOX的代码很像，所以在eval.py中还设置了--conf 0.001 --nms 0.5 --tsize 640，另外，验证时batchsize应该设置为1，因此在configs/damoyolo_tinynasL25_S.py中设置self.test.batch_size = 1（但是测试完之后，就改回为self.train.batch_size的两倍吧）

在这里插入图片描述