出自:CVPR2019
作者:PramudithaPerera
文中提出了一个新的结构,由四部分组成,分别是去噪自动编码器、潜在鉴别器、图像鉴别器、分类器
- 去噪自动编码器:相对于普通的自动编码器,在输入图像中加入了噪声,网络重构输入图像的去噪版本,这个方法减少了过拟合提高了泛化能力。还在编码器的输出层引入了双曲正切激活,使用军方误差损失训练自动编码器
- 潜在鉴别器:为了获得一个潜在空间,作者显示的强制类内示例的潜在表示在潜在空间中均匀分布,
方法是构建一个潜在判别器Dl 训练区分给定类的真实的潜在表征和从U(-1,1)d 分布中提取的样本。损失函数为
- 图像判别器:潜在空间中的所有样本通过decoder(或者叫generator)生成的图像应该来自于给定类的图像的空间。为了满足这个约束,构建第二个判别器,来判别给定类的图像和从隐空间随机采样通过decoder之后生成的图像。
- 分类器:判别生成的图像和给定类的图像的相似度。使用给定类图像作为正样本,生成图像作为负样本。损失函数为二类交叉熵(BCE)。
最终结构是:
整体训练过程: