CVPR 2021|可操控的GAN——Hijack-GAN

本文介绍了Hijack-GAN,这是一种利用雅可比矩阵在预训练GAN模型中实现图像生成控制的方法。通过训练代理模型并迭代更新噪声向量,能够在保持黑盒模型性质的同时,实现对生成图像的非线性遍历和属性控制。这种方法为提高GAN的可操控性提供了新思路,并在实验中展示了有效性和优势。
摘要由CSDN通过智能技术生成

©PaperWeekly 原创 · 作者 | 孙裕道

学校 | 北京邮电大学博士生

研究方向 | GAN图像生成、情绪对抗样本生成

前言

该论文是关于 GAN 图像生成类的文章,并收录于 CVPR 2021。当前 GAN 表现出越来越强的性能,其生成图像的真实感也越来越难以与自然图像区分开来,但是根植于深度学习的黑盒不可解释性的问题,GAN 也存在这个问题,即 GAN 中的输入噪声如何有方向感的生成真实样本。在该论文中作者利用雅可比矩阵对输入噪声进行迭代,从而在高度非线性的高维空间中获得对图像生成过程的控制。

该论文中的方法很简单,但是其论文提供的思想可以为打开 GAN 模型可操控性的提供了一个新的思路,非常值得一读,论文中还提供了相应的源码,感兴趣的可以下载下来跑一跑。

论文标题:

Hijack-GAN: Unintended-Use of Pretrained, Black-Box GANs

论文链接:

https://arxiv.org/abs/2011.14107

代码链接:

https://github.com/a514514772/hijackgan

Hijack-GAN

Hijack-GAN 模型的框架如下所示,该框架可以分为两部分,图片的左边部分训练一个代理模型,以从预先训练的模型中提取信息,绕过访问预先训练的模型的梯度,图片的右边部分表示在梯度的引导下生成可控制性的噪声向量。

2.1 问题描述

考虑将噪声 映射到真实图像 的生成器 ,以及将图像 映射到属性空间 的一个或多个任务模型 。在该论文中作者的目标是将在噪声空间 中找到轨迹 ,使得当沿着该路径遍历时,可以逐渐实现 GAN 模型的可控制性,具体的公式如下:

其中 是损失函数,并且模型的参数和训练数据是不可访问的,这使得优化方法无法直接求解。

2.2 非线性遍历

在该论文中作者首先训练一个代理模型来从模型中提取信息,利用数据对

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值