StyleCLIP: Text-Driven Manipulation of StyleGAN Imagery 论文阅读笔记

最新推荐文章于 2023-10-19 17:19:08 发布

芋圆526

最新推荐文章于 2023-10-19 17:19:08 发布

阅读量2.8k

点赞数 11

分类专栏：论文阅读

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_26136211/article/details/116356636

版权

StyleCLIP: Text-Driven Manipulation of StyleGAN Imagery 论文阅读笔记

笔者的话：最近看了StyleGAN的中文解析，觉得得把笔记写得通俗一点比较好，直接翻译看的好累，还不如直接看原文。从这篇开始，向他们学习！ヾ(◍°∇°◍)ﾉﾞ

创新点：

结合了StyleGAN（最近风格迁移的利器，下面会介绍）和CLIP（预训练的Text-Image模型，可以提供网络一个名词，比如老虎，对应的图片的样子）。
数据集上，这个方法可以用于多个领域，不用局限于数据注释的限制。

介绍

StyleGAN

在这里插入图片描述

核心概念如上图所示，传统的generator直接将一个位于向量空间Z的纠缠（entangled）的向量z直接作为网络的输入，而StyleGAN通过Mapping
Network（即图中一连串的FC）将z给映射到中间潜在空间W，在W中，特征的每一维代表图片的某个特征，且相互独立。这样做更利于网络学习&#

最低0.47元/天解锁文章

关注

11
点赞
踩
20

收藏

觉得还不错? 一键收藏
0
评论
StyleCLIP: Text-Driven Manipulation of StyleGAN Imagery 论文阅读笔记

StyleCLIP: Text-Driven Manipulation of StyleGAN Imagery 论文阅读笔记笔者的话：最近看了StyleGAN的中文解析，觉得得把笔记写得通俗一点比较好，直接翻译看的好累，还不如直接看原文。从这篇开始，向他们学习！ヾ(◍°∇°◍)ﾉﾞ创新点：结合了StyleGAN（最近风格迁移的利器，下面会介绍）和CLIP（预训练的Text-Image模型，可以提供网络一个名词，比如老虎，对应的图片的样子）。数据集上，这个方法可以用于多个领域，不用局限于数据注释的限
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。