yolov9 训练自己数据集<日志>

1. 下载v9代码:https://github.com/WongKinYiu/yolov9

2. 配置环境(默认已配好anaconda,python3.8+,PyTorch,)参考:https://blog.csdn.net/chenhaogu/article/details/131161374

进入自己配好的环境,终端输入:

conda activate py39(自己python环境名称)
cd N:\code\yolov9-main
pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple/

3)提示:建议不安装cleaeml,如果安装了clearml,记得注册(不注册会报错:MissingConfigError: It seems ClearML is not configured on this machine!)

1)官网注册

2)右上角进入个人主页,依次点“Setting”--“Workspace”--“+Creat new credentials”

如图,然后复制这段api(本地账户的配置,每个都不一样,所以需自己去官网获取):

3)安装clearml。终端输入:

pip install clearml -i https://pypi.tuna.tsinghua.edu.cn/simple/

安装完后继续输入:clearml-init

直接粘贴刚才复制的api,最后显示以下内容安装完成。

4. 制作数据,与v5、v7、v8相同,制作方式参考

划分好train和val数据,最终:

images内放train和val图片,labels放对应标签,图片名和标签名一定要一致。

5. 修改模型配置文件:

打开地址models/detect/yolov9-c.yaml,修改nc值,nc值为你制作的数据目标种类个数。

6. 制作数据加载配置文件  yourdata.yaml:

path: N:/code/YOLOv9/data_maker/data63  # 数据根地址
train: images/train  # train images
val: images/val  # val images、
test:   

# 定义种类名称
names:
  0: UAV

7. 按v9官网提示,终端输入:

(gpu单卡训练):win系统记得改workers为0;data为上一步制作的数据加载配置文件

python train_dual.py --workers 8 --device 0 --batch 16 --data data_maker/yourdata.yaml --img 640 --cfg models/detect/yolov9-c.yaml --weights '' --name yolov9-c --hyp hyp.scratch-high.yaml --min-items 0 --epochs 500 --close-mosaic 15

(gpu多卡训练):data为上一步制作的数据加载配置文件

python -m torch.distributed.launch --nproc_per_node 8 --master_port 9527 train_dual.py --workers 8 --device 0,1,2,3,4,5,6,7 --sync-bn --batch 128 --data data/coco.yaml --img 640 --cfg models/detect/yolov9-c.yaml --weights '' --name yolov9-c --hyp hyp.scratch-high.yaml --min-items 0 --epochs 500 --close-mosaic 15

开始训练:

记录bug:在自己电脑训练没有问题,迁移至超算后报错:

COMET ERROR: Failed to set run cmd args
Downloading https://ultralytics.com/assets/Arial.ttf to /HOME/scz0993/.config/Ultralytics/Arial.ttf...

经查询是GPU无下载权限,手动在https://ultralytics.com/assets/Arial.ttf下载后在超算输入:

cp  Arial.ttf /HOME/scz0993/.config/Ultralytics/Arial.ttf

解决问题

  • 9
    点赞
  • 33
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
您好!对于YOLOv5训练自己的数据集卡住的问题,有几个可能的原因和解决方法: 1. 数据集问题:首先要确保您的数据集格式正确无误。请检查标注文件的格式是否正确,包括标注框的坐标和类别信息是否准确。另外,确保您的数据集有足够的样本数量和样本类别的平衡性。 2. 数据预处理问题:YOLOv5在训练前会进行数据预处理,包括图像尺寸的调整、数据增强等。请检查您的数据预处理步骤是否正确,确保输入图像的尺寸和通道数与模型要求一致。 3. 参数设置问题:YOLOv5有多个训练参数需要进行配置,例如学习率、批大小、迭代次数等。确保这些参数设置合理,并根据您的硬件条件进行调整。另外,也可以尝试使用预训练模型进行初始化,以加速模型收敛。 4. 硬件性能问题:YOLOv5对显存和计算资源要求较高。如果您的显卡显存较小或者计算资源不足,可能会导致训练卡住。请确保您的硬件能够满足模型训练的要求。 5. 日志信息分析:当训练卡住时,可以查看训练过程中的日志信息,例如损失值的变化、梯度更新情况等。从日志中分析训练停滞的原因,可能是学习率设置过高或者网络结构存在问题,进而调整相关参数。 希望以上方法能够帮助您解决训练卡住的问题,祝您顺利完成YOLOv5模型的训练!如果还有其他问题,请随时提问。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值