使用GAN来进行CV数据增强(一)

本文介绍了如何使用DCGAN进行数据增强,并提出LSRO损失函数来处理生成数据的标签问题。在Person Re-identification任务中,结合DCGAN和LSRO损失,性能在多个数据集上有所提升。DCGAN的生成器和判别器结构详细阐述,LSRO则旨在避免过拟合,提高模型的鲁棒性。
摘要由CSDN通过智能技术生成

一.论文

二.论文概述

  • 使用原始数据训练DCGAN,然后根据得到的模型产生新的数据作为扩充数据用于训练
  • 设计LSRO(label smoothing regularization for outliers)损失函数,将DCGAN产生的数据的label分布标为均匀分布,比如为3分类,其lable为[1/3,1/3,1/3].
  • 加入了DCGAN产生的扩充数据,并使用LSRO后,性能在Market-1501, CUHK03, DukeMTMC-reID上能分别提升4.37%, 1.6%, 2.46%

三.论文细节

1) DCGAN[1]
  • PART1:产生器,100维的随机向量,扩充到4*4*16;之后继续扩大,通过5个反卷积,5*5的卷积核并且stride为2.额外的,一个可选的反卷积核使用的是5*5大小且stride为1的卷积核。最后出来的是128*128*3的图片。
  • PART2:生成器使用的是5个卷积层.卷积核大小也是5*5,stride为2
  • backbone用的是resne
图形数据增强是一种广泛应用于计算机视觉领域的技术,旨在通过改变图像的外观,增加训练集的多样性和数量,从而提高模型的泛化能力。而GAN(生成对抗网络)是一种深度学习架构,由生成器和判别器组成,能够生成逼真的新图像。 对图形进行数据增强GAN是利用GAN生成器的优势来增强图像数据。其基本思想是通过生成器生成一定数量的新图像,并将这些新图像与原始图像混合在一起,形成扩充的训练集。这种方法可以通过增加样本的多样性来改善模型的鲁棒性和泛化能力。 具体来说,对图形进行数据增强GAN的步骤如下: 1. 数据准备:准备一定数量的原始图形数据作为训练集。 2. 构建GAN使用GAN的生成器和判别器构建一个用于生成新图像的模型。 3. 生成新图像:通过生成器生成一定数量的新图像。 4. 混合数据集:将原始图像和生成的新图像混合在一起,形成一个扩充的训练集。 5. 训练模型:使用扩充的训练集对模型进行训练,包括生成器和判别器。 通过对图形进行数据增强GAN,可以有效地增加训练集的多样性,提高模型的泛化能力。生成器可以根据原始图像生成逼真的新图像,从而增加样本的数量和种类。通过不断迭代训练,生成器可以逐渐提高生成图像的质量。同时,通过混合原始图像和生成的新图像,可以让模型更好地学习到不同图像样式和特征。 总之,对图形进行数据增强GAN是一种有效的方法,通过生成新图像来扩充训练集,提高模型的泛化能力和表现性能。不仅可以提高图像识别、分类等任务的准确性,还可以更好地适应复杂的真实世界场景。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值