stylegan-encoder代码执行步骤和解释

最新推荐文章于 2024-09-10 09:31:00 发布

马鹏森

最新推荐文章于 2024-09-10 09:31:00 发布

阅读量1.7w

点赞数 2

分类专栏： StyleGAN代码学习

本文链接：https://blog.csdn.net/weixin_43135178/article/details/116530691

版权

10 篇文章 2 订阅

订阅专栏

在github.com 上有若干开源项目提供了源代码，我选用的开源项目是：pbaylies/stylegan-encoder，对应的网址是：https://github.com/pbaylies/stylegan-encoder

他们把解决办法称之为“stochastic clipping”（随机剪裁），其基本原理大致是：
特征码（特征向量）中每个数值通常处于一个有限的空间内，论文指出通常分布在[-1.0, 1.0]这个变动区间内，因此可以从某个特征向量开始（甚至于从全零向量开始），

论文指出，他们可以使损失函数降低到0，这样就找到了真实人脸对应的“相当精确”的特征码。

在这个开源项目里，作者把变动区间调整为[-2.0, 2.0]。有读者指出更好的变动区间是 [-0.25, 1.5]，在这个区间内能够取得更优的质量。

这个开源项目实现的效果如下图所示（左一为源图；中间是基于预训练ResNet从源图“反向”生成dlatents，然后再用这个dlatents生成的“假脸”图片；右一是经随机剪裁方法最终找到的人脸dlatens，并用这个人脸dlatents生成的极为接近源图的“假脸”）

下面介绍具体执行步骤：

在工作目录下，新建.\raw_images目录，并把需要提取特征码的真实人脸图片copy到这个目录下。

使用时，可以按一下步骤操作：

python align_images.py raw_images/ aligned_images/

python encode_images.py aligned_images/ generated_images/ latent_representations/

python encode_images.py aligned_images/ generated_images/ latent_representations/ --iterations 300 --use_mssim_loss 300

python mixed_image.py

注意：这里的mixed_image.py是https://blog.csdn.net/weixin_41943311/article/details/103348865下的复制的代码的我自己起的文件名

这个StyleGAN Encoder的核心代码结构如下图所示：

如果你有网关可以在goole等连接，那么上述步骤可以省略

备注：

（2.1）预训练的resnet50模型，用于从源图生成优化迭代的初始dlatents，
对应于karras2019stylegan-ffhq-1024x1024.pkl的反向模型finetuned_resnet.h5

（2.2）预训练的StyleGAN模型，用于从dlatents生成“假”的人脸图片
预训练的StyleGAN人脸生成模型karras2019stylegan-ffhq-1024x1024.pkl

（2.3）预训练的VGG16模型，用于从图片提取features
用于评估图片相似性的vgg16_zhang_perceptual.pkl

Pre-trained VGG16 network is used for transforming a reference image and generated image into high-level features space

流程大概是:

第3,4步默认迭代100次,可以用--iterations参数进行更改.

原文链接：https://blog.csdn.net/DLW__/article/details/104161387

关注

专栏目录