目前有很多效果不错的GAN可以做人脸translation,下面三个(StarGAN有点老,大概一年前吧)很有意思,值得借鉴。
TL-GAN
直接使用GAN,后面接一个特征鉴别网络,来提取潜空间变量的意义,这样就可以控制潜空间变量生成图像。缺点是只能生成,不能从原图像转换。TL-GAN使用了一个预训练MobileNet,然后接了GlobalAveragePooling2D和全连接,训练面部属性鉴别。
StarGAN
相当于训练一个多任务网络,输入原始图像和属性标签向量,生成的图像由鉴别器输出属性向量来得到损失。
AttGAN
类似于StarGAN,但是它把属性向量加到编码器输出z上,这样相当于希望学到一个编码器能输出中性的z,然后加入属性向量,再由解码器来生成带属性的图片。这是一个独特的思路。
(后两个本质上不能算作GAN,参见《VAE的哲学,GAN的哲学》)