5. Yolov8 Mixup数据增强详解

Mixup简介

        mixup是一种运用在计算机视觉中的对图像进行混类增强的算法,它可以将不同的图像进行混合,从而扩充训练数据集。
λ = B e t a ( α , β ) \lambda = Beta(\alpha,\beta) λ=Beta(α,β) i m g _ m i x = i m g 1 ∗ λ + i m g 2 ∗ ( 1 − λ ) img\_mix = img_1*\lambda+img_2*(1-\lambda) img_mix=img1λ+img2(1λ)其中 λ {\lambda} λ是由参数为 α {\alpha} α β {\beta} β的贝塔分布计算出来的混合系数, i m g 1 {img_1} img1 i m g 2 {img_2} img2是进行混合的样本。无论如何设置 α {\alpha} α β {\beta} β的值,期望 α α + β {\frac{\alpha}{\alpha+\beta}} α+βα 始终近似为0.5。

代码详解

import random
import numpy as np

class BaseMixTransform:
    """This implementation is from mmyolo"""

    def __init__(self, dataset, pre_transform=None, p=0.0) -> None:
        # dataset中存储着读取的数据(图片、类别和真实框位置信息)
        self.dataset = dataset
        # 进行数据增强前进行的数据预处理
        self.pre_transform = pre_transform
        # 进行数据增强的概率
        self.p = p

    def __call__(self, labels):
        # 随机进行数据增强
        if random.uniform(0, 1) > self.p:
            return labels

        # 获取一个或三个其他图像的索引
        indexes = self.get_indexes()
        if isinstance(indexes, int):
            indexes = [indexes]

        # 获取图像信息用于 Mosaic 或者 MixUp 数据增强
        mix_labels = [self.dataset.get_label_info(i) for i in indexes]

        if self.pre_transform is not None:
            for i, data in enumerate(mix_labels):
                mix_labels[i] = self.pre_transform(data)
        labels["mix_labels"] = mix_labels

        # 进行 Mosaic 或 MixUp
        labels = self._mix_transform(labels)
        labels.pop("mix_labels", None)
        return labels

    def _mix_transform(self, labels):
        raise NotImplementedError

    def get_indexes(self):
        raise NotImplementedError

class MixUp(BaseMixTransform):

    def __init__(self, dataset, pre_transform=None, p=0.0) -> None:
        super().__init__(dataset=dataset, pre_transform=pre_transform, p=p)

    # 获取另一个图像的索引
    def get_indexes(self):
        return random.randint(0, len(self.dataset) - 1)

    def _mix_transform(self, labels):
        # Applies MixUp augmentation https://arxiv.org/pdf/1710.09412.pdf
        # 混合系数
        r = np.random.beta(32.0, 32.0)  # mixup ratio, alpha=beta=32.0
        labels2 = labels["mix_labels"][0]
        # 根据混合系数将两张图片mixup
        labels["img"] = (labels["img"] * r + labels2["img"] * (1 - r)).astype(np.uint8)
        labels["instances"] = Instances.concatenate([labels["instances"], labels2["instances"]], axis=0)
        labels["cls"] = np.concatenate([labels["cls"], labels2["cls"]], 0)
        return labels
  • 0
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 7
    评论
引用\[1\]中提到了yolov5中使用的数据增强方法,其中包括马赛克增强、模糊、中值滤波、转化成灰度图、上下翻转、水平翻转等操作。马赛克增强是通过在图像中添加马赛克来增强数据。模糊操作使用随机尺寸的核来模糊图像。中值滤波是一种去除图像噪声的方法。转化成灰度图是将图像转化为灰度图像。上下翻转和水平翻转是对图像进行镜像操作。此外,还提到了Mixup图像混叠增广的具体过程和作用。\[1\] 引用\[2\]中提供了关于Mixup图像混叠增广的参考链接,可以进一步了解该方法的实现和应用。\[2\] 引用\[3\]中给出了一个具体的例子,展示了如何使用mixup函数对两张图片进行增强,并将增强后的图片和标签输出。\[3\] 综上所述,yolov5中的mixup数据增强方法是通过将两张图片按照一定的比例进行融合,同时将它们的标签拼接在一起,从而增强数据集。这种增强方法可以提高模型的泛化能力和鲁棒性。 #### 引用[.reference_title] - *1* *2* [yolov5数据增强、代码解读](https://blog.csdn.net/weixin_41012399/article/details/119143889)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^koosearch_v1,239^v3^insert_chatgpt"}} ] [.reference_item] - *3* [yolov5-5.0版本代码详解----augmentations.py的mix_up函数](https://blog.csdn.net/nibidal/article/details/121251011)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^koosearch_v1,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 7
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值