StyleFlow 水记

fishslot

已于 2022-09-23 16:25:29 修改

阅读量397

点赞数

分类专栏：我的论文笔记

于 2022-09-17 00:01:28 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/goryghost/article/details/126898696

版权

我的论文笔记专栏收录该内容

30 篇文章 4 订阅

订阅专栏

StyleFlow 水记

https://github.com/RameenAbdal/StyleFlow

论文： https://dl.acm.org/doi/10.1145/3447648

在这里插入图片描述简单来说就是，把StyleGAN的mapping network换成一个flow模型，而且是带条件的flow模型

有两个任务，

一个是根据条件生成图像，

一个是根据条件修改图像

生成使用的是 StyleGAN 和 StyleGAN2

先回忆一下 StyleGAN2 ，顺便定义下符号

StyleGAN2 会用一个先验网络，把噪声 $\mathbf{z}_{S} \in \mathbb{R}^{512}$ 映射为 $\mathbf{w} \in \mathbb{R}^{512}$ ，然后用生成器对 $\mathbf{w}$ 解码，得到 3x1024x1024 的图像

$\mathbf{z}_{S}$ 是一个高斯噪声，

$\mathbf{w}$ 用于控制 StyleGAN2 生成器中 18 个不同位置的 nromalization（同一个 $\mathbf{w}$ 重复18次）

定义一个 $\mathbf{W+}$ 空间，对 $\mathbf{w}\in\mathbf{W}+$ 有 $\mathbf{w}\in\mathbb{R}^{18\times512}$ ，表示在控制 StyleGAN2 时用 18 个不同的 $\mathbf{w}$

在训练时，使用 $\mathbf{W}$ 空间，在编辑时，使用 $\mathbf{W+}$ 空间

用一个分类器来度量图片的属性，

对于人脸，用了17类

对于任务一，根据属性生成图像

$\mathbf{z} \sim N(\mathbf{0}, \mathcal{I})\\ \mathbf{w}=\Phi(\mathbf{z}, \mathbf{a})$

$\mathbf{w}$ 的生成会考虑属性 $\mathbf{a}$

这个 $\Phi$ 是一个 flow-based 的模型，称为条件CNF（conditional continuous normalizing flow），该模型是可逆的。

$\mathbf{w}$ 经过生成器解码得到图片，图片的属性必须符合 $\mathbf{a}$ （使用分类器判断）

对于任务二，根据属性编辑图像

首先，从图片反解出编码 $\mathbf{w}_0$ ，使用的方法是 [Abdal et al. 2019; Karras et al. 2019a]

然后我们用分类器分类图片，得到当前属性 $\mathbf{a}_0$

然后用 $\mathbf{w}_0$ 和 $\mathbf{a}_0$ 反解出 $\mathbf{z}_0$ ，用的方法是作者提出的 CNF 的反转（flow模型天然就是可逆的）

然后用 $\mathbf{z}_0$ 和用户给定的属性 $\mathbf{a}_t$ 走正常流程去生成图片

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
StyleFlow 水记

StyleFlow 水记
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。