PaddlePaddle论文复现营——StarGAN v2论文解读

最新推荐文章于 2024-04-12 14:25:29 发布

wyhMiracle

最新推荐文章于 2024-04-12 14:25:29 发布

阅读量468

点赞数

文章标签：深度学习 python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/wyhMiracle/article/details/107824863

版权

StarGAN v2是为了解决图像到图像生成模型的多样性与多领域适应性问题而提出的。它通过 AdaIN 实现风格迁移，并引入多任务映射网络和多任务风格编码器，以及多任务判别器，以提高生成图像的质量、多样性和可扩展性。实验展示了其在人脸风格和动物风格迁移上的优秀表现。

摘要由CSDN通过智能技术生成

一、提出背景

论文作者认为：一个好的图像到图像的GAN模型，同时满足以下特性：
1）生成图像的多样性。既生成的图像不能太单一，具有一定的丰富性。
2）多领域的适应性。及能迁移人脸分割，也能在宠物图像上取得良好的效果。
现有的方法难以同时满足以上两点要求，因此们提出了StarGANv2。经过在CelebAHQ和AFHQ数据集上测试，表明在图像质量、多样性和可扩展性方面均具有一定优势。此外，作者提出了一个新的动物脸数据集（AFHQ），数据质量较高且变化丰富，并将这个数据集公开发布给研究社区。

二、重要概念

作者对域（domain）和风格（style）冠以比较广泛的定义。

域：一个图像集合，其中的图片可以被分类为同一种具有视觉区分度的类型。例如男、女、猫、狗等。
风格：每个图像具有的独特外观。风格则可以涵盖很多内容，比如妆容、胡子、发型等。

三、核心思想

在以前的方法中，传递迁移的条件信息是通过将属性向量输入到网络中来实现的，而本文介绍的方法没有采用这种方式，而是结合AdaIN来实现迁移的，即在feature map层面上将源图的数据分布匹配到style的分布上。
网络结构分为四个模块：生成器、多任务映射网络、多任务风格编码器和多任务判别器。
每个域的style code可由映射网络或风格编码器生成，两者的输出端都是多分支&

最低0.47元/天解锁文章

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
PaddlePaddle论文复现营——StarGAN v2论文解读

一、提出背景论文作者认为：一个好的图像到图像的GAN模型，同时满足以下特性：1）生成图像的多样性。既生成的图像不能太单一，具有一定的丰富性。2）多领域的适应性。及能迁移人脸分割，也能在宠物图像上取得良好的效果。现有的方法难以同时满足以上两点要求，因此们提出了StarGANv2。经过在CelebAHQ和AFHQ数据集上测试，表明在图像质量、多样性和可扩展性方面均具有一定优势。此外，作者提出了一个新的动物脸数据集（AFHQ），数据质量较高且变化丰富，并将这个数据集公开发布给研究社区。二、重要概
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。