【每周CV论文推荐】基于GAN的图像数据增强有哪些经典论文值得阅读

本文精选了基于GAN技术的图像生成领域的几项重要工作,包括数据扩增、仿真、单样本生成及医学应用等,旨在为读者提供深入理解GAN在图像生成领域应用的机会。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

欢迎来到《每周CV论文推荐》。在这个专栏里,还是本着有三AI一贯的原则,专注于让大家能够系统性完成学习,所以我们推荐的文章也必定是同一主题的。

当前基于GAN的二维图像生成领域的发展已经非常成熟,GAN不仅可以用于从零生成图像数据,还可以用于对数据进行增强,不仅是数量上的扩充,还包括数据质量的提升,本次我们给大家推荐一些值得阅读的文章。

作者&编辑 | 言有三

1 数据扩增BAGAN与DAGAN

在深度学习模型训练中,高质量的数据是不可或缺的,而数据的不平衡问题经常存在并且困扰模型的泛化能力。既然GAN可以用于数据生成,那么将其用于少类数据扩充进行数据增强就是典型应用,BAGAN和DAGAN就是代表性的工作。

文章引用量:1000+

推荐指数:✦✦✦✦✦

12768746f4ca7992d50431165b3c33ff.png

[1] Mariani G, Scheidegger F, Istrate R, et al. Bagan: Data augmentation with balancing gan[J]. arXiv preprint arXiv:1803.09655, 2018.

[2] Antoniou A, Storkey A, Edwards H. Data augmentation generative adversarial networks[J]. arXiv preprint arXiv:1711.04340, 2017.

2 数据仿真SimGAN

这是Apple公司发表的首篇机器学习研究论文,光是这一点就值得我们关注,本工作内容是使用GAN来进行眼球数据增强,使仿真的数据更像真实数据,从而降低真实数据获取的成本。Google也提出了类似用途的工作GazeGAN。

文章引用量:1700+

推荐指数:✦✦✦✦✦

f674a4da5b425c9936d1de96fba59b7f.jpeg

[3] Shrivastava A, Pfister T, Tuzel O, et al. Learning from simulated and unsupervised images through adversarial training[C]//Proceedings of the IEEE conference on computer vision and pattern recognition. 2017: 2107-2116.

[4] Sela M, Xu P, He J, et al. Gazegan-unpaired adversarial image generation for gaze estimation[J]. arXiv preprint arXiv:1711.09767, 2017.

3 单样本数据生成SinGAN

SinGAN是一个非常经典的one-shot多尺度图像生成框架,它可以基于单张图像进行训练,训练后的模型可以生成新的图像,新的图像与训练图像有类似的几何结构与纹理信息,非常适合用于自然图像生成。

文章引用量:500+

推荐指数:✦✦✦✦✦

6a269fdde84c4289accb50c8274a578d.png

[5] Shaham T R, Dekel T, Michaeli T. Singan: Learning a generative model from a single natural image[C]//Proceedings of the IEEE/CVF International Conference on Computer Vision. 2019: 4570-4580.

4 医学领域应用

医学领域是一个典型的缺少数据并且标注成本较高的行业,因此GAN在其中有较多的应用。比如通过基本的数据增强方法和GAN框架联合训练,研究者将其用于肝损伤(liver lesion)医学图像生成,然后用于分类任务。通过输入图像和掩膜监督生成视网膜光学相干断层扫描(retinal optical coherence tomography,OCT)图像,然后用于分割任务。更多的工作请大家自行了解。

文章引用量:2000+

推荐指数:✦✦✦✦✦

2e9b5cc05f8fe0b88a85d647abb93eb0.png

[6] Frid-Adar M, Diamant I, Klang E, et al. GAN-based synthetic medical image augmentation for increased CNN performance in liver lesion classification[J]. Neurocomputing, 2018, 321: 321-331.

[7] Mahapatra D, Bozorgtabar B, Shao L. Pathological retinal region segmentation from oct images using geometric relation based augmentation[C]//Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. 2020: 9611-9620.

5 如何进行实战

为了帮助大家掌握基于GAN的图像与视频生成理论与实战!我们推出了相关的专栏课程《深度学习之图像生成GAN:理论与实践》,感兴趣可以进一步阅读:

【视频课】CV必学,超6小时,2大模块,循序渐进地搞懂GAN图像生成!

7c2f3719dc729d1f5365dcbdf54bc8ed.png

总结

本次我们介绍了基于GAN的图像数据增强的一些方法,这是GAN在图像生成领域非常好的业务落地场景,尤其是对于缺少数据的一些特定方向,感兴趣的朋友可以通过阅读这些文章进行初步了解。

有三AI- CV秋季划GAN组

b67f383fecd1a6fb569b223531220d08.png

如果想要永久系统性地跟随我们社区学习GAN的相关内容,请关注有三AI-CV秋季划GAN组,阅读了解下文:

dff6bd67f7340cea06a7b76d265df39a.png

【CV秋季划】生成对抗网络GAN有哪些研究和应用,如何循序渐进地学习好(2022年言有三一对一辅导)?

转载文章请后台联系

侵权必究

e4e8f3491c543e4dd612dabbe1a79ccc.gif

737df775420c89edd29053337a49509e.png

8373af95a80ce21696d794605679daea.png

往期相关精选

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

言有三

三人行必有AI

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值