“StyleSpace Analysis: Disentangled Controls for StyleGAN Image Generation”论文阅读
来源:CVPR2021
地址:下载链接
一篇基于隐空间构造的解耦文章,其思路是构造了一个Style因空间,认为在该空间上的编码具有更好的解耦效果。
1 Motivation
1) 目前的风格迁移任务通常需要成对样本,并且需要较多的监督信息;
2) 目前方法的单个属性通常与其他属性存在纠缠,并且其作用是非局部的。
2 Contribution
1) 分析了隐空间对于图像解耦生成效果的影响;
2) 提出了一种基于样式编码通道的属性检测即可视化方法;
3) 提出了一种新的解耦评价指标属性依赖(Attribute Dependency)。
3 Approach
3.1 不同隐空间介绍
首先介绍一下论文里使用的隐空间的定义:
1) Z \mathcal{Z} Z空间:最原始的输入空间,一般是标准正态分布或均匀分布,也就是我们通常说的随机噪声空间;
2) W \mathcal{W} W空间:对 Z \mathcal{Z} Z空间使用一系列全连接层变换得到潜在空间,通常认为比 Z \mathcal{Z} Z空间更好地反映学习到的解纠缠性质;
3) W + \mathcal{W}+ W+空间:与 W \mathcal{W} W空间的构造方法比较类似,但是 生成器每一层被投喂的潜在向量 w w w是不同的,常被用于风格混合(Style Mixing)和图像反演(Image Inversion)。
4) S \mathcal{S} S空间:基于 W \mathcal{W} W空间进行进一步的变换,对于生成器的每一层,均使用一个不同的仿射变换(Affine Transformations,进行一次线性变换,再接一个平移操作)将 w ∈ W {\mathcal{w}} {\in} \mathcal{W} w∈W