“StyleSpace Analysis Disentangled Controls for StyleGAN Image Generation”论文阅读

最新推荐文章于 2023-10-15 16:50:58 发布

巍巍微澜

最新推荐文章于 2023-10-15 16:50:58 发布

阅读量1.1k

点赞数

分类专栏：生成模型文章标签：深度学习计算机视觉人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44846680/article/details/122427087

版权

本文分析了StyleSpace Analysis论文，探讨了StyleGAN如何通过Style空间实现图像解纠缠生成。论文提出了属性控制和解耦评价指标，展示了在Style空间中进行属性编辑的高效性和线性可分性。

摘要由CSDN通过智能技术生成

“StyleSpace Analysis: Disentangled Controls for StyleGAN Image Generation”论文阅读

来源：CVPR2021

地址：下载链接

一篇基于隐空间构造的解耦文章，其思路是构造了一个Style因空间，认为在该空间上的编码具有更好的解耦效果。

1 Motivation

1）目前的风格迁移任务通常需要成对样本，并且需要较多的监督信息；

2）目前方法的单个属性通常与其他属性存在纠缠，并且其作用是非局部的。

2 Contribution

1）分析了隐空间对于图像解耦生成效果的影响；

2）提出了一种基于样式编码通道的属性检测即可视化方法；

3）提出了一种新的解耦评价指标属性依赖（Attribute Dependency）。

3 Approach

3.1 不同隐空间介绍

首先介绍一下论文里使用的隐空间的定义：

1） $\mathcal{Z}$ 空间：最原始的输入空间，一般是标准正态分布或均匀分布，也就是我们通常说的随机噪声空间；

2） $\mathcal{W}$ 空间：对 $\mathcal{Z}$ 空间使用一系列全连接层变换得到潜在空间，通常认为比 $\mathcal{Z}$ 空间更好地反映学习到的解纠缠性质；

3） $\mathcal{W}+$ 空间：与 $\mathcal{W}$ 空间的构造方法比较类似，但是生成器每一层被投喂的潜在向量 $w$ 是不同的，常被用于风格混合（Style Mixing）和图像反演（Image Inversion）。

4） $\mathcal{S}$ 空间：基于 $\mathcal{W}$ 空间进行进一步的变换，对于生成器的每一层，均使用一个不同的仿射变换（Affine Transformations，进行一次线性变换，再接一个平移操作）将 ${\mathcal{w}} {\in} \mathcal{W}$

最低0.47元/天解锁文章

关注

0
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
“StyleSpace Analysis Disentangled Controls for StyleGAN Image Generation”论文阅读

一篇基于隐空间构造的解耦文章，其思路是构造了一个Style因空间，认为在该空间上的编码具有更好的解耦效果。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。