YOLO v8目标检测（二）—v8理论与模型推理

最新推荐文章于 2024-08-22 20:17:27 发布

程序小旭

最新推荐文章于 2024-08-22 20:17:27 发布

阅读量591

点赞数 15

分类专栏：人工智能算法深度学习文章标签： YOLO 目标检测人工智能

本文链接：https://blog.csdn.net/weixin_46167190/article/details/140733130

版权

人工智能算法同时被 2 个专栏收录

61 篇文章 3 订阅

订阅专栏

深度学习

48 篇文章 0 订阅

订阅专栏

YOLO v8目标检测

数据增强

使用场景：在数据加载器加载数据的过程中会使用到数据增强的相关方法，来构造数据集。模型推理方法进行学习之前首先复习了解图像数据增强的相关方法和步骤。

其中在v8的源代码中 augment.py 的源代码文件。它包含了几个用于数据增强的类和函数。

BaseTransform 是一个基类，用于定义图像的变换操作。
Compose 是一个组合多个变换操作的类。
BaseMixTransform 是一个基类，用于定义图像混合的操作。
Mosaic 是一个具体的混合操作类，用于将多个图像组合成一个马赛克图像。

下面的一个图给出了在加载不同数据集的基础上数据增强的执行过程。

在这里插入图片描述

其中v8_transforms(dataset, imgsz, hyp, stretch=False)用于对yolo v8网络中的数据集进行图像增强的操作。

pre_transform = Compose(
        [
            Mosaic(dataset, imgsz=imgsz, p=hyp.mosaic),
            CopyPaste(p=hyp.copy_paste),
            RandomPerspective(
                degrees=hyp.degrees,
                translate=hyp.translate,
                scale=hyp.scale,
                shear=hyp.shear,
                perspective=hyp.perspective,
                pre_transform=None 
                if stretch 
                else LetterBox(new_shape=(imgsz, imgsz)),
            ),
        ]

return Compose(
        [
            pre_transform,
            MixUp(dataset, pre_transform=pre_transform, p=hyp.mixup),
            Albumentations(p=1.0),
            RandomHSV(hgain=hyp.hsv_h, sgain=hyp.hsv_s, vgain=hyp.hsv_v),
            RandomFlip(direction="vertical", p=hyp.flipud),
            RandomFlip(direction="horizontal", p=hyp.fliplr, flip_idx=flip_idx),
        ]
    )  # transforms