【飞桨PaddlePaddle论文复现课程】【GAN】论文解读之StarGAN v2

最新推荐文章于 2022-07-18 19:23:42 发布

FlyingPie

最新推荐文章于 2022-07-18 19:23:42 发布

阅读量732

点赞数

分类专栏：深度学习文章标签：计算机视觉深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/BobAuditore/article/details/107906622

版权

深度学习专栏收录该内容

13 篇文章 0 订阅

订阅专栏

一、前言

论文复现课程链接：https://aistudio.baidu.com/aistudio/education/group/info/1340

这篇博客主要是对飞桨PaddlePaddle论文复现课程中 GAN 论文的解析.

二、论文解读

论文的任务是多域图像转换（Multiple Domain Image-to-Image translation）

涉及到2个关键概念：

Domain：一组可以分为视觉上独特类别的图像

Style：每个图像都有唯一的外观

论文动机：

2.1 创新点

StarGAN v2 的论文有cGAN， CycleGAN， StarGAN等

文献全称：StarGAN v2: Diverse Image Synthesis for Multiple Domains
文献出处：[J]. arXiv: Computer Vision and Pattern Recognition, 2019

代码：https://github.com/clovaai/stargan-v2
数据集：CelebA-HQ、AFHQ
评价标准：FID、LPIPS、AMT User Study（亚马逊机器人用户研究，即肉眼看图）

论文贡献（亮点）

跳出了starGAN使用域标签向量的思维惯性，为每个域生成多个style code，通过AdaIN完成迁移，同时保证生成的多样性。
介绍了自己搜集的数据集，动物脸部数据集（AFHQ）

2.2 方案解析

使用到的别的论文中的损失函数有：

StarGAN V2 对比 StarGAN：

StarGANv2，使用所提出的domain-specific style code替换域标签，前者可表示特定领域的各种风格样式。引入两个模块，一个映射网络mapping network和一个样式编码器style encoder。

StarGAN v2 方案解析：

映射网络学习将随机高斯噪声转换为样式码(style code)，而编码器则学习从给定的参考图像中提取样式码。两个模块都具有多个输出分支，每个分支都提供特定域的样式码，训练时将选取其中对应domain的一个。

生成器Generator（最左边黑色）：将输入图像x转换为G(x,s)，s为样式码style code，可以由映射网络F或者样式编码器E提供。使用adaptive instance normalization (AdaIN) 引入s。

生成器Generator：删除了上采样residual blocks中的所有shortcut，并使用基于adaptive wing based heatmap添加了跳跃连接。

损失函数设计：

分为4部分：

2.3 实验解析

生成的图像结果：

2.4 评价

有关GAN的论文中，比较突出的现象是cherry-picking，即生成的图像中只选部分好的展示。另外即使是正常比例看起来比较好的图片，放大后的细节，和真实也有很大差距。

2.5 代码解析

参考：

1）https://blog.csdn.net/WhaleAndAnt/article/details/105093047

2）百度飞桨顶会论文复现营PPT

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
【飞桨PaddlePaddle论文复现课程】【GAN】论文解读之StarGAN v2

一、前言论文复现课程链接：https://aistudio.baidu.com/aistudio/education/group/info/1340这篇博客主要是对飞桨PaddlePaddle论文复现课程中GAN论文的解析.二、论文解读论文的任务是多域图像转换（Multiple Domain Image-to-Image translation）涉及到2个关键概念：Domain：一组可以分为视觉上独特类别的图像Style：每个图像都有唯一的外观论文动机：...
复制链接

扫一扫

专栏目录

博客等级

码龄12年

20
原创

29
点赞

64
收藏

13
粉丝

关注

私信

热门文章

分类专栏

机器学习 1篇
Linux 2篇
深度学习 13篇
工具 3篇
Python 2篇

最新评论

windows上的cuda8和cuda9切换，win10 + vs2015
我有明珠一颗: 太棒啦，我这边是为了配合tensorflow，甚至都不用把“Path中CUDA9的路径改成非实际路径”这一步，直接重启pycharm，就可以用了，显示：Successfully opened dynamic library cudart64_100.dll
windows上的cuda8和cuda9切换，win10 + vs2015
大扬哥啦啦啦: 你好请问使用python也是要重启vs么？还是怎么操作
windows上的cuda8和cuda9切换，win10 + vs2015
The_Matrix_: 总结的很好
Caffe多任务训练时忽略部分无用或未标注类标
gailysun: 作者好，请问你说的“多任务训练的时候，假设有N个任务，但部分图片类标不全，或者只对其中x（0<x<N）个任务有用，该怎么训练呢？这在tensorflow里面很好实现，合并loss的时候加上判断就行了”请问这个在tensorflow里具体是怎么操作的，求指教
N卡双显卡电脑装ubuntu15.04并配置Anaconda+Tensorflow+cuda+cuDNN的深度学习环境
monkey66da: 引用「monkey66da: 我没打过这个命令，不过首先你用的是15.04吗？...」我把我的安装经历写了下来，希望博主帮忙看下问题，谢谢！http://blog.csdn.net/u011918106/article/details/53352584

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。