个人的总结

最新推荐文章于 2024-04-08 22:11:22 发布

HaoyuanChen14

最新推荐文章于 2024-04-08 22:11:22 发布

阅读量323

点赞数

文章标签：深度学习人工智能计算机视觉

本文链接：https://blog.csdn.net/qq_44088619/article/details/125294190

版权

AgileGAN中encoder部分的构建

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档

文章目录

StyleGAN
StyleGAN2
AgileGAN
- 主体架构
一、pandas是什么？
二、使用步骤
- 1.引入库
- 2.读入数据
总结

StyleGAN

StyleGAN 的网络结构包含两个部分，第一个是Mapping network，即下图 (b)中的左部分，由隐藏变量 z 生成中间隐藏变量 w的过程，这个 w 就是用来控制生成图像的style，即风格，为什么要多此一举将 z 变成 w 呢，后面会详细讲到。第二个是Synthesis network，它的作用是生成图像，创新之处在于给每一层子网络都喂了 A 和 B，A 是由 w 转换得到的仿射变换，用于控制生成图像的风格，B 是转换后的随机噪声，用于丰富生成图像的细节，即每个卷积层都能根据输入的A来调整"style"。整个网络结构还是保持了 PG-GAN （progressive growing GAN）的结构。最后论文还提供了一个高清人脸数据集FFHQ。

此外，传统的GAN网络输入是一个随机变量或者隐藏变量 z，但是StyleGAN 将 z 单独用 mapping网络将z变换成w，再将w投喂给 Synthesis network的每一层，因此Synthesis network中最开始的输入变成了常数张量，见下图b中的Const 4x4x512。

StyleGAN论文

1.使用Instance Norm

AdaIN,实现风格迁移，但是在StyleGAN2论文中阐述说因为该模块造成雨滴效应，故舍弃。

2. 使用Mapping network对latent code解耦

Mapping network 要做的事就是对latent space进行解耦

简单理解就是，为了更好的对数据进行分类或生成，需要对数据的特征进行表示，但是数据有很多特征，这些特征之间相互关联，耦合性较高，导致模型很难弄清楚它们之间的关联，使得学习效率低下，因此需要寻找到这些表面特征之下隐藏的深层次的关系，将这些关系进行解耦，得到的隐藏特征，即latent code。由 latent code组成的空间就是 latent space。

Mapping network由8个全连接层组成，通过一系列仿射变换，由 z 得到 w，这个 w 转换成风格，结合 AdaIN (adaptive instance normalization) 风格变换方法。

3.Style mixing

通过Mapping network生成两个latent code，然后对Style mixing找到控制不同style的latent code的区域位置。

GAN评价指标

GAN评价指标，论文中使用了FID，Path length，Separability。

StyleGAN2

AgileGAN

主体架构

encoder的主要构建流程：使用pSp中VAE编码器进行编码，初始值使用的是Resnet50在FFHQ上的的预训练参数。
encoder是通过训练进行得到的实现自动学习，不改变空间

提示：以下是本篇文章正文内容，下面案例可供参考

一、pandas是什么？

示例：pandas 是基于NumPy 的一种工具，该工具是为了解决数据分析任务而创建的。

二、使用步骤

1.引入库

代码如下（示例）：

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import warnings
warnings.filterwarnings('ignore')
import  ssl
ssl._create_default_https_context = ssl._create_unverified_context

2.读入数据