机器学习与深度学习系列连载：第四部分对抗网络GAN (四) 对抗网络 Cycle GAN

最新推荐文章于 2024-05-17 23:24:58 发布

人工智能插班生

最新推荐文章于 2024-05-17 23:24:58 发布

阅读量517

点赞数

分类专栏：深度学习 GAN 神经网络对抗网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/dukuku5038/article/details/85059899

版权

深度学习同时被 3 个专栏收录

53 篇文章 9 订阅

订阅专栏

51 篇文章 1 订阅

订阅专栏

9 篇文章 2 订阅

订阅专栏

对抗网络GAN (四) 对抗网络 Cycle GAN

我们目前看到的GAN都是有正确结果做参照的GAN（Supervised），但是如果没有正确结果做参照（Unsupuervised）的。

最典型的例子就是风格迁移了（和Style Transfer算法不通，我们这里考虑用GAN），我们要把普通的照片迁移成梵高的画作，以前是没有这样的例子的，无从参考。

在这里插入图片描述

我们还可以把进行声音转换：男人的声音转换成女人的

在这里插入图片描述

以上就是非监督条件下的结构化数据生成。

1. 直接转换 Direct Transfermation

首先我们需要一个鉴别器D，能够区分正常画作和梵高的画作。这样，生成器G就需要生成的图片能够“骗过” D

在这里插入图片描述

直接转换过程中，我们是有个前提条件的，并不是生成梵高的画作就是好的，我们还有尊重原来照片的内容。

在这里插入图片描述

我们需要增加Y到X的生成，进行内容的一致设定，确保照片内容不变形。

这个时候我们需要两个鉴定器Dx（鉴定是不是梵高的画作）和Dy（鉴定是不是普通照片），
还有两个生成器Gx（照片到梵高），Gy（梵高到照片）

对于普片转换成梵高的画作，我们针对结果进行限制，是不是很像AutoEncoder
对于梵高的画作转换成普通图片，我们结果限制，是不是很像AutoEncoder

把以上两个结合起来，就是Gycle GAN

在这里插入图片描述

2. Star GAN

在Cycle GAN中有Domain X 和 Domain Y之间的互相转换，如果Domain特别多，转换起来的复杂度非常大。是 $C^{2}_{n}$ 中转换方式。我们需要统一集中的转换。

Star GAN（来自论文Yunjey Choi, arXiv, 2017）就是做一个中心转换节点：
在这里插入图片描述

我们举一个实际例子说明问题：
我们的目标是生成一个棕色长发的男子。

在这里插入图片描述
lable就是 00101，每一位代表一个domain

同样，我们有不通情绪的domain
在这里插入图片描述

然后通过Star GAN进行不通domain间的转换（中间reconstruction的目的是保证图片的内容不失真）
在这里插入图片描述

我们修改图片表情也这样：
在这里插入图片描述

3.直接投射到普通空间 Projection to Common Space

在这里插入图片描述
投射的过程很像是Autoencoder的过程。从DomainX (照片)到 DomainY（动漫）

训练的过程：
在这里插入图片描述
但是上图的训练过程会造成一个现象，两个Autoencoder相对独立，并没有将图片投射到同一个空间。而且没有鉴别器D。

实际上，我们训练的过程：
在这里插入图片描述
目标是: encoder 和 Decoder的参数共享。

训练模型是：（参考
Couple GAN[Ming-Yu Liu, et al., NIPS, 2016]
UNIT[Ming-Yu Liu, et al., NIPS, 2017]
）
在这里插入图片描述

4. 声音互转应用

我们从图片的的框框跳出来，用一个人的声音转换成另一个人的声音。

一般的，我们如果用监督学习，必须将两个都都请过来，一起念一些文字（必须是同样的内容），记录声音，然后用监督学习硬train。
在这里插入图片描述

但是使用GAN后，两个人甚至使用的不同语言，说不同的事情（训练数据），都可以用声音互转。（英语发音的人就会用洋腔洋调说中文哦）

在这里插入图片描述

本专栏图片、公式很多来自台湾大学李宏毅老师的深度学习课程,在这里，感谢这些经典课程，向李老师致敬！

人工智能插班生

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
机器学习与深度学习系列连载：第四部分对抗网络GAN (四) 对抗网络 Cycle GAN

对抗网络GAN (四) 对抗网络 Cycle GAN我们目前看到的GAN都是有正确结果做参照的GAN（Supervised），但是如果没有正确结果做参照（Unsupuervised）的。最典型的例子就是风格迁移了（和Style Transfer算法不通，我们这里考虑用GAN），我们要把普通的照片迁移成梵高的画作，以前是没有这样的例子的，无从参考。我们还可以把进行声音转换：男人的声音转换成女...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。