使用GAN来进行CV数据增强（一）

最新推荐文章于 2024-01-07 02:10:08 发布

Mmm_Zzz

最新推荐文章于 2024-01-07 02:10:08 发布

阅读量1w

点赞数 1

分类专栏：计算机视觉

本文链接：https://blog.csdn.net/mmm_zzz/article/details/81813934

版权

本文介绍了如何使用DCGAN进行数据增强，并提出LSRO损失函数来处理生成数据的标签问题。在Person Re-identification任务中，结合DCGAN和LSRO损失，性能在多个数据集上有所提升。DCGAN的生成器和判别器结构详细阐述，LSRO则旨在避免过拟合，提高模型的鲁棒性。

摘要由CSDN通过智能技术生成

Unlabeled Samples Generated by GAN Improve the Person Re-identiﬁcation Baseline in vitro
论文代码：layumi/Person-reID_GAN

使用原始数据训练DCGAN，然后根据得到的模型产生新的数据作为扩充数据用于训练
设计LSRO(label smoothing regularization for outliers)损失函数，将DCGAN产生的数据的label分布标为均匀分布，比如为3分类，其lable为[1/3,1/3,1/3].
加入了DCGAN产生的扩充数据，并使用LSRO后，性能在Market-1501, CUHK03, DukeMTMC-reID上能分别提升4.37%, 1.6%, 2.46%

PART1：产生器，100维的随机向量，扩充到4*4*16；之后继续扩大，通过5个反卷积，5*5的卷积核并且stride为2.额外的，一个可选的反卷积核使用的是5*5大小且stride为1的卷积核。最后出来的是128*128*3的图片。
PART2：生成器使用的是5个卷积层.卷积核大小也是5*5，stride为2
backbone用的是resne