5. Yolov8 Mixup数据增强详解

兔子Code

已于 2023-08-17 14:32:26 修改

阅读量3.7k

点赞数

分类专栏： pytorch数据处理文章标签： YOLO 深度学习

于 2023-08-17 14:31:43 首次发布

本文链接：https://blog.csdn.net/YXD0514/article/details/132339921

版权

pytorch数据处理专栏收录该内容

8 篇文章

订阅专栏

Mixup简介

mixup是一种运用在计算机视觉中的对图像进行混类增强的算法，它可以将不同的图像进行混合，从而扩充训练数据集。
$\lambda = Beta(\alpha,\beta)$ $img\_mix = img_1*\lambda+img_2*(1-\lambda)$ 其中 ${\lambda}$ 是由参数为 ${\alpha}$ ， ${\beta}$ 的贝塔分布计算出来的混合系数， ${img_1}$ 和 ${img_2}$ 是进行混合的样本。无论如何设置 ${\alpha}$ ， ${\beta}$ 的值，期望 ${\frac{\alpha}{\alpha+\beta}}$ 始终近似为0.5。

代码详解

import random
import numpy as np

class BaseMixTransform:
    """This implementation is from mmyolo"""

    def __init__(self, dataset, pre_transform=None, p=0.0) -> None:
        # dataset中存储着读取的数据（图片、类别和真实框位置信息）
        self.dataset = dataset
        # 进行数据增强前进行的数据预处理
        self.pre_transform = pre_transform
        # 进行数据增强的概率
        self.p = p

    def __call__(self, labels):
        # 随机进行数据增强
        if random.uniform(0, 1) > self.p:
            return labels

        # 获取一个或三个其他图像的索引
        indexes = self.get_indexes()
        if isinstance(indexes, int):
            indexes = [indexes]

        # 获取图像信息用于 Mosaic 或者 MixUp 数据增强
        mix_labels = [self.dataset.get_label_info(i) for i in indexes]

        if self.pre_transform is not None:
            for i, data in enumerate(mix_labels):
                mix_labels[i] = self.pre_transform(data)
        labels["mix_labels"] = mix_labels

        # 进行 Mosaic 或 MixUp
        labels = self._mix_transform(labels)
        labels.pop("mix_labels", None)
        return labels

    def _mix_transform(self, labels):
        raise NotImplementedError

    def get_indexes(self):
        raise NotImplementedError

class MixUp(BaseMixTransform):

    def __init__(self, dataset, pre_transform=None, p=0.0) -> None:
        super().__init__(dataset=dataset, pre_transform=pre_transform, p=p)

    # 获取另一个图像的索引
    def get_indexes(self):
        return random.randint(0, len(self.dataset) - 1)

    def _mix_transform(self, labels):
        # Applies MixUp augmentation https://arxiv.org/pdf/1710.09412.pdf
        # 混合系数
        r = np.random.beta(32.0, 32.0)  # mixup ratio, alpha=beta=32.0
        labels2 = labels["mix_labels"][0]
        # 根据混合系数将两张图片mixup
        labels["img"] = (labels["img"] * r + labels2["img"] * (1 - r)).astype(np.uint8)
        labels["instances"] = Instances.concatenate([labels["instances"], labels2["instances"]], axis=0)
        labels["cls"] = np.concatenate([labels["cls"], labels2["cls"]], 0)
        return labels