stargan论文解读

1,论文题目
在这里插入图片描述
2,内容简介
在这里插入图片描述
在这里插入图片描述
3,论文背景

图像到图像的风格转化,在这之前就有比较出名的cyclegan。那么之后为什么会有stargan的发现呢?stargan的出发点又有什么不同呢?

为了回答这个问题,我们先介绍cyclegan

cyclegan能做把图片的斑马变成马,实现简单的风格迁移

在这里插入图片描述
cyclegan能实现简单的两个图像间的风格转移。那么问题来了.

当我有一个目标图像,想把他转换为N种风格,那我是不是得有N个cyclegan得模型呢?我们能不能用一种模型来实现目标图像的多种风格转化呢?

由此,就有我们今天要讲的STARGAN

下图左边(a)表示的是cyclegan的结构模型,如果他要实现四种风格迁移的话,他需要43个模型(K种风格就需要k(k-i)个模型)。如下图右边是stargan的结构模型,他要实现五种风格迁移的话,他只需要一个模型就能实现五种风格迁移。接下来介绍stargan是怎么运作的
在这里插入图片描述

4,stargan运行原理

在这里插入图片描述
第一步G(ab);首先输入input图片(提供整体结构),在输入内容图像(提供风格),把内容图像经过one-hot编码生成标签(如11111代表女人,00000代表男人)。在这个过程,我们已经,告诉计算机我们想要的目标及他的风格,在通过生成器生成一张fake image,这个过程简称G(ab)。

第二步G(ba);具体意义就是,我这张fake image 能还原为input图片吗?因为,我只要做风格转化,你生成器别把我的input图片整体框架也改变了。
在这里插入图片描述
像如图所示,我想要把input转化为黄头发。但是蓝色箭头,红色箭头都能生成你要的黄头发的风格,但是红色箭头把我input的图像框架给改变了,所以说,我们最后通过G(ba)这个过程,让G(ab)生成的fake image,能还原为iuput,确保目标不变,仅风格变。

第三步判别,我们把fake image通过判别器,看这个图片的解码标签是否与我的需求风格标签一致,是的话输出,否的话,重复上面循环。

5,stargan是否还有改进的地步呢?

我们知道,我们给风格定义,用的是标签(00000/11111之类的one-hot编码),标签它本身与它图片之间是没有任何联系的,他只是我们人为的,把这两者相联系(就像每个人都有一个名字一样,这个名字本身就没有意义,名字只是一个标签而已)

那么问题来了;怎么加强这两者(标签与风格图片)之间的联系呢?

我们可以把标签换成向量,这个向量是通过风格图片得到的
如图所示

在这里插入图片描述
这个改进,成就了后来的stargan v2版本
在这里插入图片描述
参考链接

  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
StarGAN v2是一种先进的图像生成模型,旨在将一组输入图像转换为多个可能的目标域图像。该模型具有许多有用的功能和创新。 首先,StarGAN v2建立在StarGAN的基础上,通过引入一个新的概念,即多个生成器和判别器,大大提高了模型的生成能力。每个生成器与一个特定目标域相关联,并且可以从输入图像生成与目标域相关的图像。多个判别器用于提供有关输入图像和生成图像之间的真实性的反馈,从而帮助生成更高质量的图像。 其次,StarGAN v2引入了一个新的概念称为样式代码。样式代码是一个向量,代表了输入图像和目标域之间的潜在特征。通过改变样式代码的值,可以在目标域中生成具有不同外观和特征的图像。这使得模型更加灵活和可控,用户可以根据需要对图像进行个性化的转换。 另外,StarGAN v2还引入了两个重要的改进,称为判别器样式适应和循环一致性损失。判别器样式适应用于提高判别器的性能,使其能够更好地区分生成图像和目标域中真实图像之间的区别。循环一致性损失则用于确保生成器能够在两个目标域之间进行无缝转换,而不会丢失细节或信息。 最后,StarGAN v2通过使用特征对齐损失进一步提高了生成图像的质量。特征对齐损失用于确保在生成图像和真实图像之间的特征分布保持一致,从而使得生成图像更加逼真和真实。 总之,StarGAN v2是一个令人印象深刻的图像生成模型,通过引入多个生成器和判别器、样式代码、判别器样式适应、循环一致性损失和特征对齐损失,实现了高质量和高度可控的图像转换。它在许多应用领域,如人脸生成和图像风格迁移中具有巨大的潜力。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值