Diverse Image-to-Image Translation via Disentangled Representations(ECCV18)

3 Disentangled Representation for I2I Translation

two visual domains: X ∈ R H × W × 3 \mathcal{X}\in\mathbb{R}^{H\times W\times 3} XRH×W×3 Y ∈ R H × W × 3 \mathcal{Y}\in\mathbb{R}^{H\times W\times 3} YRH×W×3
unpaired samples: x ∈ X x\in\mathcal{X} xX y ∈ Y y\in\mathcal{Y} yY

如Fig.3所示,整个framework包含

  • two content encoders { E X c , E Y c } \left \{ E_\mathcal{X}^c, E_\mathcal{Y}^c \right \} {EXc,EYc}
  • two attribute encoders { E X a , E Y a } \left \{ E_\mathcal{X}^a, E_\mathcal{Y}^a \right \} {EXa,EYa}
  • two generators { G X , G Y } \left \{ G_\mathcal{X}, G_\mathcal{Y} \right \} {GX,GY}
  • two discriminators { D X , D Y } \left \{ D_\mathcal{X}, D_\mathcal{Y} \right \} {DX,DY}
  • one content discriminator D c D^c Dc
3.1 Disentangle Content and Attribute Representations

Our approach embeds input images onto a shared content space C \mathcal{C} C, and domain-
speci c attribute spaces, A X \mathcal{A}_\mathcal{X} AX and A Y \mathcal{A}_\mathcal{Y} AY.

这个思想特别好,因为无论是哪一个domain,content信息是公共的,与domain无关的
但attribute是带有各自domain特性的,是domain相关的

4个Encoder所做的事情
{ z x c , z x a } = { E X c ( x ) , E X a ( x ) } z x c ∈ C , z x a ∈ A X { z y c , z y a } = { E Y c ( y ) , E Y a ( y ) } z y c ∈ C , z y a ∈ A Y ( 1 ) \begin{aligned} &\left \{ z_x^c, z_x^a \right \}=\left \{ E_\mathcal{X}^c(x), E_\mathcal{X}^a(x) \right \}\qquad z_x^c\in\mathcal{C}, z_x^a\in\mathcal{A}_\mathcal{X} \\ &\left \{ z_y^c, z_y^a \right \}=\left \{ E_\mathcal{Y}^c(y), E_\mathcal{Y}^a(y) \right \}\qquad z_y^c\in\mathcal{C}, z_y^a\in\mathcal{A}_\mathcal{Y} \qquad(1) \end{aligned} {zxc,zxa}={EXc(x),EXa(x)}zxcC,zxaAX{zyc,zya}={EYc(y),EYa(y)}zycC,zyaAY(1)

对于 { E X c , E Y c } \left \{ E_\mathcal{X}^c, E_\mathcal{Y}^c \right \} {EXc,EYc},共享最后一层
对于 { G X , G Y } \left \{ G_\mathcal{X}, G_\mathcal{Y} \right \} {GX,GY},共享第一层

Through weight sharing, we force the content representation to be mapped onto the same space.

Q:不知道作者是否做了对比实验来验证共享的好处

为了进一步增强content空间的公共性,引入一个content discriminator D c D^c Dc,用于辨别 { z x c , z y c } \left \{ z_x^c, z_y^c \right \} {zxc,zyc},于是有content adversarial loss如下
L a d v c o n t e n t = ( 2 ) L_{adv}^{content}= \qquad(2) Ladvcontent=(2)

注:在content空间添加判别器,最终会使得两个domain的content分布逼近,由此实现domain无关,这一点和自己的ACMMM18论文思想一样的,叙述上也是从information的角度来描述

3.2 Cross-cycle Consistency Loss

利用Encoder,将图像 x , y x, y x,y分别分解为content成分和attribute成分,然后进行“移花接木”

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值