yolov5中的mosaic实现原理

最新推荐文章于 2024-02-19 17:24:51 发布

龙城肥酱

最新推荐文章于 2024-02-19 17:24:51 发布

阅读量4.4k

点赞数 7

文章标签：计算机视觉 python 人工智能

本文链接：https://blog.csdn.net/qq_41011242/article/details/110439183

版权

mosaic图像增强技术基于现有数据极大的丰富了样本的多样性，极大程度降低了模型对于多样性学习的难度

本文将对yolov5中mosaic实现的核心源码进行解析并结合自身项目经历谈下其局限性

mosaic实现位于datasets.py中的load_mosaic()函数，入参是当前训练的图片序号，出参是一幅经过mosaic图像增强的图片及其label

经过如下步骤得到mosaic增强图像：

step1. 假设模型输入尺寸为s，生成一幅尺寸为2s * 2s的灰色图

step2. 从点A（s/2, s/2）和点B（3s/2, 3s/2）限定的矩形内随机选择一点作为拼接点，代码如下

yc, xc = [int(random.uniform(-x, 2 * s + x)) for x in self.mosaic_border]  # mosaic center x, y

step3. 随机选择四张图，取其部分拼入该图，如下图所示，四种颜色代表四张样本图，超出的部分将被舍弃

step4. 将图片进行变换后得到最终输出，对应代码和示意图如下

    # Augment
    img4, labels4 = random_perspective(img4, labels4,
                                       degrees=self.hyp['degrees'],
                                       translate=self.hyp['translate'],
                                       scale=self.hyp['scale'],
                                       shear=self.hyp['shear'],
                                       perspective=self.hyp['perspective'],
                                       border=self.mosaic_border)  # border to remove

龙城肥酱

关注

7
点赞
踩
19

收藏

觉得还不错? 一键收藏
4
评论
yolov5中的mosaic实现原理

yolov5中的mosaic实现原理mosaic图像增强技术基于现有数据极大的丰富了样本的多样性，极大程度降低了模型对于多样性学习的难度本文将对yolov5中mosaic实现的核心源码进行解析并结合自身项目经历谈下其局限性mosaic实现位于datasets.py中的load_mosaic()函数，入参是当前训练的图片序号，出参是一幅经过mosaic图像增强的图片及其label经过如下步骤得到mosaic增强图像：step1. 假设模型输入尺寸为s，生成一幅尺寸为2s * 2s的灰色图
复制链接

扫一扫