DA-GAN: Instance-level Image Translation by Deep Attention Generative Adversarial Networks阅读笔记

论文链接:https://arxiv.org/abs/1802.06454

一、图像翻译

通过从一个图像域到另一个图像域找到一些底层对应关系(例如,类似的语义)来学习映射函数,这就是图像翻译问题。翻译的原则是保留源域的预期身份(例如,文本到图像中的语义,面对动画中的人类ID),同时生成与目标域的分布匹配的样本。

二、目前技术挑战

多年的研究已经在有足够的配对的监督环境中产生了强大的翻译系统。然而,获得配对的训练数据是困难且昂贵的。因此,研究人员转向开发无监督学习方法,该方法仅依赖于不成对数据,它更具挑战性。

现有的工作建立在生成对抗网络(GAN)之上,然而,它们仅受到数据分布的整体表征的训练,而缺乏推理机制来在抽象层面推理数据。隐式训练过程和弱可控性使他们无法找到有意义的实例级对应关系,此限制通常会导致误报(例如几何或语义伪像),并进一步导致模式崩溃问题。文本-图像翻译和对象变形任务示例如下图所示:
在这里插入图片描述
在文本到图像的合成中,通常缺少细粒度的细节;在对象变形中,结果只显示颜色和纹理的变化,而几何变化失败。

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值