Pixel-Level Domain Transfer1,以下简称为Pixel-Level,是一种image-to-image 的conditional GAN。Pixel-Level试图解决的问题是:给定一个服装模特,输出该服装。
原理
使用GAN
在给定一张源图时,生成的答案应该是不唯一的,如上图所示。在损失函数中,若直接计算生成出的目标图片图片 I ^ T \hat{I}_{T} I^T和样本中给出的目标图片 I T {I}_{T} IT的均方差,例如 ∥ I ^ T − I T ∥ 2 2 \left\|\hat{I}_{T}-I_{T}\right\|_{2}^{2} ∥∥∥I^T−IT∥∥∥22,作为损失的话,会丢失其他的可能性。并且均方差假定了所有像素遵循高斯分布,这会导致生成的图像模糊不清。
为了解决这个问题,使用鉴别器来作为损失函数的一部分,生成清晰且多样的图像。
使用两个鉴别器
对于一个生成器的生成的结果,文中将其分为 I ^ T + , I ^ T ⊕ , I ^ T − \hat{I}_{T}^{+}, \hat{I}_{T}^{\oplus}, \hat{I}_{T}^{-} I^T+,I^T⊕,<