Designing an Encoder for StyleGAN Image Manipulation论文解读

官方源码和论文地址
又是基于StyleGAN用于图像编辑的又一力作!
基于StyleGAN做图像编辑,首先要找到隐向量(GAN inversion),这个过程的主流方式有两种:

  • 优化隐向量,找寻能重构出指定图像的隐向量。代表有image2style,in-domian GAN。
  • 设计一个Encoder,用于将图像映射到StyleGAN的隐空间上。代表有style-encoder。
  • 其实还有一种比较小众,利用分类器的思想,步骤也繁琐。代表有interpretGAN。

IDEA

目前基于styleGAN的图像编辑,评判的标准有两个,重构出来的效果以及可编辑性的强弱,作者分别用distortion(扭曲程度)和editability(编辑能力)代表。很可惜的是,一般扭曲程度低的方法,编辑能力弱。这是因为找到的隐向量已经离stylegan的W空间很远了,不是一个分布。比如image2style就提出,在W+空间优化隐向量,可以重构出任意一行图像,不管是不是人脸图像,但可编辑能力大大降低。
作者认为,找到的隐向量为好的标准就是解决W空间。接近有两层含义:1. 每个style code之间的方差小;2.每个style code都在W空间中。
围绕以上两个原则,作者提出e4e(encoder for editing),一个编码器,用于将指定图像映射到隐空间上。同时还提出了一个用于评判隐向量重构性能和可编辑性能的综合性指标。
同时作者在正式介绍encoder之前,首先分析了扭曲程度和感知效果之间的关系。image2style已经指出,stylegan可以重构出任意的图像,不管是不是训练集中的图像样式。但找到的隐向量的编辑能力却很差,这是因为隐向量已经不在W空间了。此时该空间记作W空间。
在这里插入图片描述
如上图所示,在W
空间有更好的重构效果,但在此隐向量上进行编辑,得到的图像的感知效果就很低,说明可编辑性很小。这说明,扭曲程度和可编辑性是两个矛盾的东西,想要可编辑性高,就要损失一定的重构效果。
在这里插入图片描述
W W W: stylegan的style map 的输出空间
W k W^k Wk:还是在W空间,只不过有k个不同的向量,每个向量是对应的style modulation的输入,将被映射到W+空间。
W ∗ W_* W:不在W空间,仅为了满足最大重构效果。不考虑可编辑性,如使用一些优化方式得到。
W ∗ k W_*^k Wk:不在W空间,有是k个不同的向量,每个向量是对应的style modulation的输入,将被映射到W+空间。

Method

(作者关于GAN inversion的related work写的挺全面的,有兴趣的可以去读一下)
作者之所以选择encoder-based的inversion方法,原因有两点:

  • 快速,因为基于优化的方式,要迭代很多次以上。stylegan2的project是1000次,大概7分钟。
  • 让encoder的输出控制在W空间中更适合编辑,基于优化的方式不容易控制隐向量的分布。

一个好的encoder,需要输出空间接近W空间。想要做到这一点:

  • 可以优化每个风格向量的方差,让其尽量小,极限的情况是完全一样;
  • 并足够接近stylegan的W空间

优化方差

为了到达第一个目的,作者提出渐进训练方法。
首先encoder记作E,输入是指定图像x。输出是N个style code。
E ( x ) = ( w , Δ 1 , . . . Δ N − 1 ) E(x) = (w, \Delta_1,...\Delta_{N-1}) E(x)=(w,Δ1,...ΔN1)
后面N-1项是偏置,加在w上得到N个style code,具有不同的值,N就是stylegan中的style modulation层的数目。该空间记作 W ∗ k W^k_* Wk空间。在训练初期,让所有的偏置都为0,这样N个向量都是相同的,都是 w w w。即先鼓励encoder往 W ∗ W_* W空间上靠。然后逐渐的让偏置不一样,这样每个style modulation层都有不同的style code,灵活性更高,保证了重构质量,实现了从 W ∗ W_* W空间上 W ∗ k W^k_* Wk的变化。其实如果偏置都为0,encoder也倾向于向 W W W空间靠。但因为学习偏置的关系,离W空间也不远,也保证了可编辑的能力。距离由网络自己学习,自行权重可编辑性和重构性的tradeoff。
为了让偏置临近 W ∗ W_* W空间,作者设置了一个浅显易懂的正则损失:
在这里插入图片描述

优化和W空间的距离

因为styleGAN的W空间并不能显式建模,所有作者使用了对抗思想,设置一个latent code discriminator( D W D_W DW)区分encoder的分布和W空间的分布。用同一个判别器,使用所有N个style code和真实的原始W空间向量。将N个loss求平均优化。
在这里插入图片描述

实现细节

在这里插入图片描述

在这里插入图片描述

loss function

  • 用来优化扭曲程度的loss,有基于自监督的loss,感知loss,L2loss
    在这里插入图片描述
  • 用来优化可编辑能力的loss,有偏置正则loss,和隐空间判别器和encoder之间的对抗loss。
    在这里插入图片描述
    在这里插入图片描述

LEC指标(Latent Editing Consistency)

不介绍了,比较容易理解。

实验

作者设置了4个对照组
在这里插入图片描述

离W空间的距离

作者评估了encoder的输出空间的方差,D组是最小的。其实评估了离W空间的距离,使用的方式是从W空间采样得到隐向量,经过G,再用E映射到隐空间,对比两个隐向量的期望。
在这里插入图片描述

### 回答1: 设计线性和开关电源的控制回路是一项重要的工作,可以保证电源的性能和稳定性。线性和开关电源是常见的电源类型,其工作原理和性能要求略有不同。 线性电源的控制回路主要包括电压反馈回路和当前反馈回路。电压反馈回路通过测量输出电压,并经过稳压器和放大器进行反馈控制。当前反馈回路则测量输出电流,并通过电流传感器和比较器对电流进行反馈控制。这些回路可以调整电源的输出电压和电流,以维持所需的稳定状态。 开关电源的控制回路则更加复杂。开关电源通过开关器件的周期性开关操作来控制输出电压和电流。其控制回路一般包括脉冲宽度调制器(PWM)和反馈控制回路。PWM负责将输入信号转换为开关器件的开关信号,以控制输出电压和电流的波形。反馈控制回路通过测量输出电压和电流,并将其与参考信号进行比较,通过调整PWM的占空比来实现输出的稳定性。 在设计控制回路时,需要考虑电源的负载变化、输出纹波、响应时间等因素。同时,选择合适的控制器、传感器和滤波器等元件也是很重要的。通过模拟和仿真等手段,可以优化和调整控制回路的参数,以满足特定的设计要求。 总之,设计线性和开关电源的控制回路需要综合考虑电源的特性和要求,并选择合适的控制方法和元件,以实现稳定、高效的电源输出。 ### 回答2: 设计线性和开关电源的控制环路涉及电源系统的稳定性和反馈机制。电源控制环路的设计目标是在负载变化时保持输出电压的稳定性和精确性。 线性电源的控制环路通常包括一个稳压器,在输入电压和负载变化时调整输出电压以保持在设定范围内。其中最常见的稳压器是线性稳压器和开环控制的电源。 开关电源的控制环路更复杂。开关电源通常通过高频开关和磁性元件(例如变压器和电感器)来转换输入电压。控制环路中的关键组件包括比较器、误差放大器、PWM(脉宽调制)控制器和反馈网络。通过比较输出电压与设定值,误差放大器将误差信号放大并传递给PWM控制器。PWM控制器以一定的频率开关开关管,调整开关管的开关周期和占空比,以使输出电压保持在设定范围内。 在设计控制环路时,需要考虑几个因素。首先,必须选择恰当的控制架构,包括类型和配置。其次,需要确定合适的反馈机制,以确保输出电压的准确性和稳定性。并且,必须采取适当的补偿措施,以保证系统的稳态和动态响应。最后,需要进行模拟和实验验证,以确保控制环路的性能和可靠性。 综上所述,设计线性和开关电源的控制环路是一项复杂的任务,涉及到稳定性、反馈机制和精确性。正确设计和实施控制环路可以确保电源系统的性能和稳定性。 ### 回答3: 线性电源和开关电源是常用的电源类型,用于为电子设备提供稳定的电压和电流。设计控制回路对于这两种电源都非常重要。 对于线性电源,控制回路的设计旨在实现稳定的输出电压。线性电源基于传统的电压调节器原理,输入电压经过变压器降压后,通过功率晶体管进行调整,以实现所需的输出电压。控制回路可以监测输出电压,并在需要时调整功率晶体管的导通时间或频率,以保持输出电压的稳定性。这可以通过使用反馈电路来实现,其中输出电压与参考电压进行比较,并根据差异来调整控制元件。设计控制回路还需要考虑输入电压变化、负载变化等因素对输出电压的影响。 对于开关电源,控制回路的设计旨在实现高效率和稳定的输出。开关电源通过周期性地开关功率开关,将输入电压转换为高频脉冲信号,再经过滤波器和转换器,最后输出所需的稳定电压。控制回路可以监测输出电压和电流,并相应地调整开关时间和频率,以保持输出的稳定性和效率。这可以通过使用PWM(脉宽调制)技术来实现,其中输出电压与参考电压进行比较,并根据差异来调整开关元件的控制信号。设计控制回路还需要考虑输入电压范围、负载变化、开关频率等因素对输出稳定性和效率的影响。 总结起来,设计控制回路对于线性电源和开关电源都是至关重要的。通过使用适当的反馈电路和PWM技术,可以确保输出电压稳定、效率高,并满足电子设备的需求。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值