数据扩展（mixup）

最新推荐文章于 2023-06-18 22:26:11 发布

蓝鲸鱼BlueWhale

最新推荐文章于 2023-06-18 22:26:11 发布

阅读量4k

点赞数 3

分类专栏：计算机视觉文章标签：深度学习机器学习 python pytorch 计算机视觉

本文链接：https://blog.csdn.net/weixin_44579633/article/details/119297291

版权

计算机视觉专栏收录该内容

56 篇文章 21 订阅

订阅专栏

本文介绍一种新的数据扩展方法mixup。

1. mixup原理

mixup是一种对图像进行混类增强的算法，它可以将不同类之间的图像以线性插值的方式进行混合，从而构建新的训练样本，扩充训练数据集。
在这里插入图片描述
其中，(xi,yi)和(xj,yj)是从训练数据中随机抽取的两个样本，且λ∈[0,1]。

对于输入的一个batch的待测图片images，我们将其和随机抽取的图片按照系数λ加权相加，λ∈[0,1]，符合beta分布
将1中得到的混合张量inputs传递给模型得到输出张量outputs
计算损失函数时，针对两个图片的标签分别计算损失函数，然后按照比例λ进行损失函数的加权求和，即

for i,(images,target) in enumerate(train_loader):
    # 加载第一张图片和标签
    images = images.cuda(non_blocking=True)
    target = torch.from_numpy(np.array(target)).float().cuda(non_blocking=True)

    # 加载参数
    alpha = config.alpha
    lam = np.random.beta(alpha,alpha)

	# 用来融合的图片的序号
    index = torch.randperm(images.size(0)).cuda()

	# 将两张图片按照比例系数lam加权求和
    inputs = lam*images + (1-lam)*images[index,:]

	# 两张图片的标签
    targets_a, targets_b = target, target[index]

	# 将融合后的图片输入给网络
    outputs = model(inputs)

	# 损失函数按照比例系数lam加权求和
    loss = lam * criterion(outputs, targets_a) + (1 - lam) * criterion(outputs, targets_b)

    # 梯度更新
    optimizer.zero_grad()   # reset gradient
    loss.backward()
    optimizer.step()        # update parameters of net

我们可视化mixup这个过程，两张图片的mixup结果随着lam的变化而发生渐变：

for i in range(1,10):
    lam= i*0.1
    im_mixup = (im1*lam+im2*(1-lam)).astype(np.uint8)
    plt.subplot(3,3,i)
    plt.imshow(im_mixup)
plt.show()

在这里插入图片描述
实际代码中的lam由随机数生成器控制，lam符合参数为(alpha,alpha)的beta分布，默认取alpha=1，这里的alpha是一个超参数，alpha的值越大，生成的lam偏向0.5的可能性更高。

2. 目标检测中应用mixup的例子

对于目标检测的话，步骤：

图1和图2按照比例lam进行线性融合
送入模型进行检测
分别按标签计算损失函数，按照lam加权相加得到最终的损失函数。

在这里插入图片描述

参考文献
知乎：目标检测中图像增强，mixup 如何操作？Pascal的回答

蓝鲸鱼BlueWhale

关注

3
点赞
踩
34

收藏

觉得还不错? 一键收藏
1
评论
数据扩展（mixup）

本文介绍一种新的数据扩展方法。参考文献【深度学习】Mixup: Beyond Empirical Risk Minimization
复制链接

扫一扫

专栏目录

数据扩展 （mixup）

1. mixup原理

2. 目标检测中应用mixup的例子

“相关推荐”对你有帮助么？

数据扩展（mixup）