YOLOv7训练自己的数据集

_Mallow_

已于 2023-09-01 15:26:29 修改

阅读量292

点赞数 1

文章标签： YOLO 深度学习机器学习

于 2023-09-01 15:17:33 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_48821657/article/details/132624619

版权

YOLOv7训练自己的数据集

上一个博客中讲了怎么安装，并利用COCO数据集训练好的权重进行检测。这个博客讲怎么利用train.py文件来训练自己的数据集。

准备数据集

数据集的准备已经有很多教程讲过，随便一搜就有，对于标注文件来说比较重要的是标注格式，YOLOv7的会将边框进行归一化，标注文件格式如下：

种类中心横坐标比中心纵坐标比宽度比高度比

看起来就像下图中所示，第一列的3、4、5代表种类，后面的用来表示位置。
请添加图片描述

所以在训练之前需要将格式更改为对应YOLOv7的格式，转格式同样也有很多教程，是比较简单的数学计算和txt文件写入。因为不同数据集的标注格式不同，所以推荐大家直接搜索数据集名怎么转YOLO格式。

数据集存放结构一般如下图，我用的是VisDrone数据集。cache文件是在训练时生成的临时文件（比如在这一轮要训练这几张，就临时生成方便读取），直接删了没关系。

请添加图片描述

实际上YOLO支持读取的数据格式还比较灵活，在project中的coco.yaml里可以看到，有三种结构可以用，所以如果使用我所展示的方式3（这种情况是常用于数据集已经分好三类train val和test），只要注意文件名不出错就行。

请添加图片描述

新建并更改yaml文件

新建yaml文件是为了让YOLO知道你的数据集种类总数，种类名称和数据集存储位置。

请添加图片描述

其实就和上面所说的存储方式比较灵活，但是注意images和labels名称不要搞错。

nc就是种类总数，names是种类名。

以YOLOv7模型为例，打开文件cfg/trainning底下的yolov7.yaml，可以直接改也可以新建一个你想要的名字，需要改的只有nc，改为你的数据集种类总数。YOLOv7使用了autoanchor，这使得你不用自己设置anchors。

运行train.py文件

把train.py拉到下面可以看到一系列参数设置。以YOLOv7模型为例：

初始权重–weights是yolov7.pt(YOLOv7在readme中也提供了用于迁移训练的初始权重，但实际上训练轮次多了之后这个初始权重对训练结果并没有什么影响)；

–cfg和–data就改为刚刚修改好的对应的yaml文件；

–hpy如果设备支持或者数据量比较小的情况下可以试着改出较好的参数；

–epochs也是试出来的，建议先设置一个大的比如200，然后观察训练曲线，选择比较适合的轮次。

请添加图片描述

batch-size和img-size也看设备，支持就大点，不支持的话16和640也是比较好的选择。

这些参数可以在文件中直接修改，也可以在命令行中输入，比如

python train.py --device 0 --batch-size 32 --data data/custom.yaml --img 640 640 --cfg cfg/training/yolov7-custom.yaml --weights 'yolov7_training.pt' --name yolov7-custom --hyp data/hyp.scratch.custom.yaml

得到结果

数据集大且轮次多的话会运行很久很久，也许需要一整天。训练结果默认存储在runs/train里。

请添加图片描述

如果训练次数比较多，建议及时存储得到的权重结果并改名，不然一个一个看图分辨很麻烦（不要问我怎么知道的）。虽然runs里会给一些曲线，但是我感觉使用tensorboard看更方便和全面。
tensorboard的使用方法是直接在命令行中输入

tensorboard --logdir=./runs/train

这样可以可视化训练结果。
在这里插入图片描述

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
YOLOv7训练自己的数据集

利用yolov7项目中的train.py文件来训练自己的数据集
复制链接

扫一扫

_Mallow_ CSDN认证博客专家 CSDN认证企业博客

码龄4年

9: 原创

134万+: 周排名

28万+: 总排名

4755: 访问

: 等级

116: 积分

3: 粉丝

12: 获赞

5: 评论

10: 收藏

私信

关注

热门文章

最新评论

（pytorch）可视化模型中某一tensor(利用matplotlib)
CSDN-Ada助手: 恭喜您写了第9篇博客！标题看起来很有趣，我很期待阅读您关于在pytorch中利用matplotlib可视化模型中某一tensor的内容。您的博客一直都很有价值，为读者提供了很多实用的技术指导和解决方案。在下一步的创作中，我建议您可以考虑分享一些关于如何在pytorch中使用其他可视化工具的方法，或者探索如何优化模型的可视化效果。您的谦虚态度和专业知识一直是我学习的榜样，期待您继续创作！
YOLOv7训练自己的数据集
CSDN-Ada助手: 恭喜您写了第8篇博客！标题“YOLOv7训练自己的数据集”非常吸引人，我非常期待阅读您的文章。您的创作内容一直非常有深度和实用性，为读者提供了很多有价值的知识和经验。希望您能继续保持创作的热情，为我们带来更多关于YOLOv7的内容。作为下一步的创作建议，我希望您能够分享一些关于数据集准备方面的心得和技巧。因为在实际应用中，准备一个好的数据集对于模型的训练和性能至关重要。希望您能够结合自己的经验，给出一些实用的建议和方法，帮助读者更好地应用YOLOv7模型。再次感谢您的分享，期待您的下一篇博客！
YOLOv7原文翻译
_Mallow_: 不知道，你选文献翻译之前最好先问一下你的导师吧
YOLOv7使用记录
CSDN-Ada助手: 恭喜您撰写了第7篇博客！标题“YOLOv7使用记录”非常吸引人，我很高兴看到您在持续创作。阐述您对YOLOv7的使用经验无疑对其他人来说是非常有价值的。接下来，我希望您能继续分享您在YOLOv7方面的进一步探索。也许您可以深入研究一些高级技术或是提供一些实用的应用案例。期待在您的下一篇博客中再次获得新的启发。继续加油！
YOLOv7原文翻译
m0_55111953: 博主，文献翻译要求这么严格的吗？我也正准备用这篇呢，害怕了

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。