[深度学习从入门到女装]Semantic Image Synthesis with Spatially-Adaptive Normalization

论文地址:Semantic Image Synthesis with Spatially-Adaptive Normalization

 

一篇很有意思的文章,是NVIDIA公司出品,讲语义图像合成的改进,使用了一个space的normalization

 

语义图像合成就是给一个语义图像,如上图的第一行,然后使用这个语义图像合成现实图像

 

目前呢,normalization分为两种,一种是uncondition的,就如Instance Normalization、Layer Normalization (LN) 、Group Normalization (GN) 、andWeight Normalization(WN),Batch Normalization等,就是使用输入来进行权重的学习,然后作用到输入上

还有一种是condition的,是使用额外的输入(condition)来进行权重的学习,然后作用在输入上

图2就是本文所提出的方法,叫做SPatially-Adaptive(DE)normalization1 (SPADE),跟batch normal一样,是作用在channel上的

,用公式表达就是这样

如图所示,就是先对输入进行一个batch normal,也就是这个部分,对于输入进行一个均值和方差的计算

,然后进行归一化,随后使用额外的输入(condition)来进行这两个参数的学习,注意,这两个参数在batch normal中是一个vector,也就是不包含空间信息的,在SPADE中是一个tensor,也就是包含空间信息的,然后这两个参数是使用conv来学习到的,最后将进行归一化的输入对这两个参数进行element-wise的相乘和相加,得到最后的输出

 

其实这个SPADE的方法,给我的感觉,就是一个attention模块嵌入到了batch normal中

 

文中提到说,SPADE有效的原因,最直接的是因为可以更好的直接提供语义信息,在每次normal都使用到了原始的语义信息

 

因为这个SPADE的方法,因此本文的网络就不再需要encoder了

整个网络的结构如上图所示,原始的生成网络都是用encoder-decoder的模式,比如pix2pixHD,先使用多个下采样进行encoder,然后在使用上采样进行decoder得到最后的结果,本文的生成网络只需要decoder,在每一步SPADE的时候,用上语义信息

 

 

 

 

 

 

  • 4
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值