概述
这是一篇cvpr2018的oral文章,大体内容是用时下非常流行的GAN网络做人脸的年龄老化图片生成,主要的贡献点在于:
1、同时解决了生成图片年龄准确性和个人信息保留两个核心问题。
2、在实验过程中注意到了人脸前额和头发的保留能提升实验结果,于是采用完整的而非裁剪过的图片作数据集。
3、在各个数据集上取得了很好的效果,并在图片有遮挡,化妆的情况下表现出很强的鲁棒性。
显然整篇文章的核心还是在于第一个贡献点。
方法
我认为文章提出的方法主要有两个亮点,一个是多loss,GAN网络的loss+个人信息保留的loss+pixel的loss,
另一个则是判别器的多尺度提取特征,也就是文章标题的金字塔结构。
生成器
生成器的结构比较简单,先encode再decode的一个U型结构,三层卷积层,四层残差,最后三层转置卷积,每一层卷积层后都接一个BN和ReLU,并且整个网络都没有pooling层,而是用大小为3,步长为2的卷积层下采样,这些都是目前CNN的常规配置。
生成器的loss由三部分组成: