InstaGAN:Instance-Aware Image To Image Translation

论文:InstaGAN
代码:Github

做了什么?

现有无监督Image-Image translation的缺点:

  • 涉及多目标的时候,转换效果不佳
  • 物体外形变化比较大的时候,转换效果不佳


    1794530-80a9665fb7ec8904.png
    多目标示例图

以上图为例,多个绵阳迁移到长颈鹿就是一个多目标,且形状变化较大的例子。作者提出的InstaGAN就在一定程度上解决了上述问题。

怎么做的?

基于上述问题,作者提出了InstaGAN。考虑图像转换中多个目标的Instance information(比如分割的masks)。使得完成属性迁移的同时,背景保持不变。背景保持不变通过引入context preserving loss来鼓励网络去学习一个目标示例的之外的一个恒等映射。此外,作者提出一种sequential mini-batch的方法以处理生成多个instance时内存不足的问题,同时也提升了生成效果。

总结说来,作者的贡献包括三方面:

  • 提出了一个多属性图像翻译的网络结构,且属性之间的顺序是任意的
  • 提出了context preserving loss来鼓励网络去学习一个目标示例的之外的一个恒等映射
  • 提出一种sequential mini-batch的方法顺序生成mini-batchs的属性,而不是在整个数据集上做一次。

具体方法

整个模型基于CycleGAN,这两年基于CycleGAN的工作一大堆(基本上就是应用到不同领域,并加个约束)。不了解的可以看博客CycleGAN

1794530-5ddcd361778680e1.png
网络框架图

相比于CycleGAN,就是对生成器添加了目标的masks,并且判别器也加了masks。这样可以使得生成的判别器除了能鉴别是否是目标域的数据之外,还可以鉴别其形状(避免出现像上面cycleGAN的结果里面把长劲鹿脖子弄变形的情况)。

三点主要工作

多属性图像翻译的网络结构,属性之间顺序任意

测试阶段:

  • 上图中间original image通过提取特征
  • original masks通过提取特征,不同的mask代表不同的object。注意上图的Add操作,这个使得不同的mask之间存在时序不变性。
  • 将mask的特征和original image的特征进行级联并重构

训练阶段:

  • 除了上述步骤之外,还需要利用对masks的特征转换成目标域的mask。
  • 判别器需要对重构后的图像,以及masks判断其一致性。

context preserving loss

这个比较简单,其实就是把加一个约束,保证masks之外的信息保持不变(下式中的项)。整个loss如下:

1794530-431752bf3330f9db.png
loss

值得注意的是,上述目标域的mask生成没有使用监督信息,而是使用cycle consistency来约束目标域的mask,这样可以使得生成的mask更加鲁棒,比如处理一些遮挡的情况。

sequential mini-batch

当mask增加时,由于的存在,所需显存也是成倍增长,因此这里使用sequential的方法,其实就是渐进迭代的方法。具体看下图:

1794530-030f49bc8fa324a2.png
sequential mini batch

把mask分开,一个个生成就好了。但是这里要注意,通常小的mask放到后面效果会更好。因为迭代进行的话,每次生成的图片都会被改变,后面如果是大mask,很容易把前面生成的小mask跟淹没掉。

所以,使用这种办法,一定程度上破坏了object mask之间的时序不变性,如果GPU显存足够,就不要用这种方法了。

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
【优质项目推荐】 1、项目代码均经过严格本地测试,运行OK,确保功能稳定后才上传平台。可放心下载并立即投入使用,若遇到任何使用问题,随时欢迎私信反馈与沟通,博主会第一时间回复。 2、项目适用于计算机相关专业(如计科、信息安全、数据科学、人工智能、通信、物联网、自动化、电子信息等)的在校学生、专业教师,或企业员工,小白入门等都适用。 3、该项目不仅具有很高的学习借鉴价值,对于初学者来说,也是入门进阶的绝佳选择;当然也可以直接用于 毕设、课设、期末大作业或项目初期立项演示等。 3、开放创新:如果您有一定基础,且热爱探索钻研,可以在此代码基础上二次开发,进行修改、扩展,创造出属于自己的独特应用。 欢迎下载使用优质资源!欢迎借鉴使用,并欢迎学习交流,共同探索编程的无穷魅力! 基于业务逻辑生成特征变量python实现源码+数据集+超详细注释.zip基于业务逻辑生成特征变量python实现源码+数据集+超详细注释.zip基于业务逻辑生成特征变量python实现源码+数据集+超详细注释.zip基于业务逻辑生成特征变量python实现源码+数据集+超详细注释.zip基于业务逻辑生成特征变量python实现源码+数据集+超详细注释.zip基于业务逻辑生成特征变量python实现源码+数据集+超详细注释.zip基于业务逻辑生成特征变量python实现源码+数据集+超详细注释.zip 基于业务逻辑生成特征变量python实现源码+数据集+超详细注释.zip 基于业务逻辑生成特征变量python实现源码+数据集+超详细注释.zip
提供的源码资源涵盖了安卓应用、小程序、Python应用和Java应用等多个领域,每个领域都包含了丰富的实例和项目。这些源码都是基于各自平台的最新技术和标准编写,确保了在对应环境下能够无缝运行。同时,源码中配备了详细的注释和文档,帮助用户快速理解代码结构和实现逻辑。 适用人群: 这些源码资源特别适合大学生群体。无论你是计算机相关专业的学生,还是对其他领域编程感兴趣的学生,这些资源都能为你提供宝贵的学习和实践机会。通过学习和运行这些源码,你可以掌握各平台开发的基础知识,提升编程能力和项目实战经验。 使用场景及目标: 在学习阶段,你可以利用这些源码资源进行课程实践、课外项目或毕业设计。通过分析和运行源码,你将深入了解各平台开发的技术细节和最佳实践,逐步培养起自己的项目开发和问题解决能力。此外,在求职或创业过程中,具备跨平台开发能力的大学生将更具竞争力。 其他说明: 为了确保源码资源的可运行性和易用性,特别注意了以下几点:首先,每份源码都提供了详细的运行环境和依赖说明,确保用户能够轻松搭建起开发环境;其次,源码中的注释和文档都非常完善,方便用户快速上手和理解代码;最后,我会定期更新这些源码资源,以适应各平台技术的最新发展和市场需求。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值