NVIDIA SPADE 风景合成

“涂鸦”变风景 NVIDIA SPADE

Semantic Image Synthesis with Spatially-Adaptive Normalization

利用空间适应正规化进行语义图片合成(论文

功能

Function

横向:利用分段匹配进行语义操作

从横向上看,不同的颜色代表不同的对象,譬如棕色代表树,深蓝色代表海洋。不同颜色合成出来的东西不同,不同形状合成出来的东西也不同。

纵向:利用指示图片进行风格化

从纵向上看,利用不同的指示图片合成的效果也会不一样。

方法:语义图片合成

假定 $ m \in \mathbb{L}^{H \times W}$ 是语义分段掩码(semantic segmentation mask)

\(\mathbb{L}\) : 用于表示语义标签(semantic label)的一组整数

\(m\) : 一个像素的语义标签

目标:学习匹配函数,使之能把输入分段的掩码m转换成类真实照片的图片

空间适应去正规化(Spatially-adaptive denormalization)

method

\(h_i​\):第\(i​\)层layer的激活函数
\(C_i​\):在这层layer中channel数
SPADE(SPatially-Adaptive DEnomalization):卷积正规化

激活值(\(n \in N, c \in C^i, y \in H^i, x \in W^i​\)):\(\gamma_{c,y,x}^i(m)\frac{h_{n,c,y,x}^i-\mu_c^i}{\sigma_c^i}+\beta_{c,y,x}^i(m)​\)

\(h_{n,c,y,x}^i\):正规化之前的激活函数

\(\mu_c^i​\):在channel c的激活函数的平均值

\(\mu_c^i = \frac{1}{N H^i W^i} \sum_{n,y,x}h_{n,c,y,x}^i​\)

\(\sigma_c^i​\):在channel c的激活函数的标准差

\(\sigma_c^i = \sqrt{\frac{1}{N H^i W^i} \sum_{n,y,x}(h_{n,c,y,x}^i)^2-(\mu_c^i)^2}\)

SPADE生成器

spadeG

SPADE运行结果更好的原因

这个方法能够更好地从共同正规化层中保护语义信息。

多模型合成

训练时,添加KL-Divergence损失层。

与现存方法对比

comparison

SPADE outperforms existing methods on the COCO-Stuff dataset, which is more challenging than the Cityscapes dataset due to more diverse scenes and labels. The images above are the ones authors liked.

将之用于Flickr数据库图片

apply

Since SPADE works on diverse labels, it can be trained with an existing semantic segmentation network to learn the reverse mapping from semantic maps to photos. These images were generated from SPADE trained on 40k images scraped from Flickr.

这些图片是利用训练了从Flickr上抓取的4万张图片的SPADE而生成的。

评估

metrics

转载于:https://www.cnblogs.com/KresnikShi/p/10656682.html

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值