YOLO之Mini_Rect Training(矩形训练)

最新推荐文章于 2024-07-29 10:39:14 发布

yueguang8

最新推荐文章于 2024-07-29 10:39:14 发布

阅读量1.3k

点赞数 14

分类专栏： yolo算法文章标签： YOLO 深度学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/yueguang8/article/details/136678194

版权

yolo算法专栏收录该内容

16 篇文章 27 订阅

订阅专栏

mini_rect training 又称矩形训练，是从YOLOV3开始引入的一个训练技巧。在YOLOV3之前的网络训练都是Square training，即输入图片是正方形，如 416*416、 640*640等。

Square training的优点是，图片的大小一致，方便训练处理；缺点是，在填充图片的过程中，引入了冗余信息，并且这一部分信息对于样本来说属于完全无用数据，增加了训练计算量。

下面第一张图为原始图像，分辨率为810*1080，进行正方形训练对图像进行处理后填充到640*640后如下第二张图所示，左右填充了冗余数据。

为了优化这个问题，从yolov3开始提出mini_rect training 训练策略。

mini_rect training 即对图片进行加载时，将原始图片的较长的边填充到最大长度，短边只填充到32的倍数。

处理代码如下：

经过处理后，大大缩小了原来正方形训练时引入冗余信息。矩形训练引入较少的冗余信息，可以加快训练速度。如下图所示处理后分辨率为512*640，左右冗余数据明显减少。

如果采用mini_rect training，那么整个batch内的图片的shape要一致，这就需要计算这个符合整个batch的shape。而且还要对数据集按照高宽比进行排序，这样才能保证同一个batch的图片的形状差不多相同，再选则一个共同的shape代价也比较小。

以下为yolov5/8下处理batch shape大小代码：

这就导致在dataloader时不能使用shuffle功能，如果使用shuffle功能，将随机打乱图片顺序，不能保证在一个batch处理时数据尺寸基本一致。在YOLOV8中同时设置 rect 和 shuffle会报警告信息，并禁用shuffle操作。

总结，mini_rect training是为了减少冗余信息，提高训练推理速度及精度，使用mini_rect training时不能使用shuffle操作。

关注

14
点赞
踩
11

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

博客等级

码龄16年

73
原创

1220
点赞

1548
收藏

842
粉丝

关注

私信

分类专栏

最新评论

YOLO组件之C2f模块介绍
去逃避: 看了底层代码我明白了
YOLO组件之C2f模块介绍
去逃避: 您好，请问在C2f中的Bottleneck中k的参数是k=（（3，3），（3，3）），但在bottleneck类里面是用的k=（3,3）,cv1和cv2也是用的k[ ]读取的，我理不清k=（（3，3），（3，3））是如何在bottleneck中读取的。
Python之字符串操作大全（29种方法）
是烜烜不是轩轩: 第16条split方法从左侧以a分割1次的结果是['w', 'ng da bai']
Python之字符串操作大全（29种方法）
是烜烜不是轩轩: 第16条split方法用a分割的结果是 ['w', 'ng d', ' b', 'i']
python之enumerate()函数使用总结
阿J~: 支持博主，欢迎回赞哦~

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。