Deep Identity-aware Transfer of Facial Attributes

网络分为两部分,第一部分为face transform network,得到生成图像,该网络还包括一个判别网络用于判别输入图像的真假,以及一个VGG-Face Netowork,用于判别输入图像的性别,即identity loss.

利用face transform network得到的生成图像比较模糊,因此将生成图像输入一个enhancement network,得到增强图像.

网络结构如下:

这里写图片描述

face transform network

参数如下:

face transform network由3个卷积层,5个residual block(每个residual block包含2个卷积层),再加上2个反卷积,一个卷积层得到,具体参数如下.

这里写图片描述

Identity loss

Identity loss用于生成图像与输入图像身份为相同,即为同一个人.由于不能使生成图像与输入图像像素完全相同,因此采用VGG网络提取生成图像,输入图像的特征,并计算他们的特征平方,

这里写图片描述
l 表VGG第l层的输出.利用一个卷中 wl 组合各个层的平方误差,得到Identity loss,

这里写图片描述

Attribute loss

Attribute loss是为了使生成图像与目标图像尽量相似,即满足同一分布,将生成图像输入判别网络,Attribute loss为:

这里写图片描述

判别网络参数为:

这里写图片描述

Perceptual regularization

引入Perceptual regularization项是用来去除生成图像的噪声,保持边缘的同时,图像尽量平滑.

对于含噪图像 g(n)=x+n , n 表示噪声,训练一个去噪网络,将噪声n从图像g中分离处理,得到清晰图像 x .去噪网络为一个包含2个卷积层,卷积核为3×3的网络,损失函数为:

这里写图片描述

得到去噪网络后,便可以构造Perceptual regularization损失函数:

这里写图片描述

整体的目标函数为:

这里写图片描述

Face enhancement networks

identity and attribute losses都定义为高层的特征表示,使得GAN的训练难以收敛,这些可能导致无法生成高质量的图像.因此,本文引入enhancement network对生成图像进行增强处理,以得到更加清晰的图像.

给定 attribute mask m,我们希望对于没有改变的区域,图像与输入图像尽量相似,对于改变的图像区域,我们希望增强图像尽量与生成图像相似,既有损失函数:

这里写图片描述

对于global attribute,首先利用高斯滤波得到模糊图像,再对模糊图像进行增强:

这里写图片描述

DIAT with Adaptive Perceptual Identity Loss

adaptive perceptual identity loss

这里写图片描述

这里写图片描述

DIAT-A

将adaptive perceptual identity loss加入DAN得到损失函数:

这里写图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值