论文笔记:Generative Semantic Manipulation with Mask-Contrasting GAN

主要内容

本文提出了可以对图片物体进行语义改变从而在几乎不改变物体形状、视角等信息的情况下,进行不同类别的物体替换。本文中的Mask-Contrasting GAN应用了一个conditional generator G、多个针对单个类别物体判断的判别器D_{c_y}以及一个全局判别器D_I(用于判断修改物体和背景是否和谐),使用contrasting objective、略作修改的标准GAN的objective以及cycle objective三者结合,可以得到比state of the art更好的替换效果(原文实验中在MSCOCO等多个数据集上使用多种衡量方法来衡量效果)。

具体实现

由于先前的image object manipulation工作都是针对物体的低级特征进行转换,例如颜色、纹理等;又或者有的工作对转换物体的形状和结构有比较高的限制。因此本文希望在利用图像中的语义信息,在不改变原物体形状、视角等信息的情况下,强制要求物体在语义上接近目标类。总体的效果图如下:

本文中的GAN模型和之前的模型相比,主要区别在loss函数的使用上。为了能找到描绘不同物体的语义信息特征,本模型加入了contrasting objective,具体设计见下文。增加这个loss项的有点有两个:1.可以估计每一类物体的特征中心,统计学层面上学习每个物体的语义信息特点。2.在语义manipulation和特征保留上做了平衡。另外,除去local discriminator控制语义信息,还有一个global discriminator控制修改部分和背景之间的连续性。

Contrasting GAN的objective设计

semantic manipulation的主要任务是学习一个in

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值