论文阅读——Learning to Incorporate Structure Knowledge for Image Inpainting

最新推荐文章于 2024-09-11 23:03:17 发布

keep--learning

最新推荐文章于 2024-09-11 23:03:17 发布

阅读量315

点赞数

分类专栏：论文文章标签：论文阅读深度学习人工智能计算机视觉

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_51426525/article/details/127722131

版权

论文专栏收录该内容

34 篇文章 2 订阅

订阅专栏

原文链接：Learning to Incorporate Structure Knowledge for Image Inpainting (AAAI 2020). Jie Yang, Zhiquan Qi, Yong Shi [Paper][Code]

本文创新点：

提出了一个多任务学习框架，利用图像的结构知识来辅助图像修复。
引入了结构嵌入方案，将学习到的结构特征嵌入到修复过程，指导修复。

主要思想：训练一个生成器，同时修复破损的图像和相应的结构（边缘和梯度），并用结构特征指导图像修复。

网络结构

整体网络结构还是以自编码器为基础，其中编码器是共用的。

其中，I 为真实图像，C 为梯度图，E 为边缘图，M 为掩码（0为已知区域，1为缺失区域）

其中，Ipred 为预测图像，Cpred 为预测梯度图。

Structure Embedding Layer

利用结构嵌入层，将结构特征嵌入到不同尺度的解码阶段，作为生成图像的先验。

Attention Layer

首先提取特征块，并计算余弦相似度：

其中，pi 和pj 是输入特征第i 个和第j 个patch。

然后用softmax计算注意力分数：

最后，利用残差连接将特征图x与注意力图o连接在一起：

其中，γ 为比例系数。

损失函数

Pyramid Structure Loss

金字塔结构损失主要用来指导结构的生成和嵌入，

其中，Ledge 为正则项，β为比例系数。

重构损失（L1）

感知损失

使用VGG-19的relu1_1 、relu2_1 、relu3_1 、relu4_1 和relu5_1 计算感知损失。

风格损失

其中，GΦi 为Ci *Ci 的Gram矩阵。

对抗损失

图像损失

总体损失

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
3
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 3

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。