论文阅读——Learning to Incorporate Structure Knowledge for Image Inpainting

原文链接:Learning to Incorporate Structure Knowledge for Image Inpainting (AAAI 2020). Jie Yang, Zhiquan Qi, Yong Shi [Paper][Code]

本文创新点:

  1. 提出了一个多任务学习框架,利用图像的结构知识来辅助图像修复。
  2. 引入了结构嵌入方案,将学习到的结构特征嵌入到修复过程,指导修复。

主要思想:训练一个生成器,同时修复破损的图像和相应的结构(边缘 和梯度),并用结构特征指导图像修复。

网络结构

整体网络结构还是以自编码器为基础,其中编码器是共用的。

   

其中,I 为真实图像,C 为梯度图,E 为边缘图,M 为掩码(0为已知区域,1为缺失区域)

其中,Ipred 为预测图像,Cpred 为预测梯度图。

Structure Embedding Layer

利用结构嵌入层,将结构特征嵌入到不同尺度的解码阶段,作为生成图像的先验。

Attention Layer

首先提取特征块,并计算余弦相似度:

其中,pipj 是输入特征第i 个和第j 个patch。

然后用softmax计算注意力分数:

 最后,利用残差连接将特征图x与注意力图o连接在一起:

其中,γ 为比例系数。

损失函数

Pyramid Structure Loss

金字塔结构损失主要用来指导结构的生成和嵌入,

 其中,Ledge 为正则项,β为比例系数。

重构损失(L1

感知损失

使用VGG-19的relu1_1relu2_1relu3_1relu4_1relu5_1 计算感知损失。

风格损失

其中,GΦiCi *Ci 的Gram矩阵。

对抗损失

图像损失

总体损失

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 3
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值