论文阅读——Multi-Scale Image Contextual Attention Learning for Inpainting

最新推荐文章于 2023-01-24 21:57:47 发布

keep--learning

最新推荐文章于 2023-01-24 21:57:47 发布

阅读量341

点赞数

分类专栏：论文文章标签：论文阅读深度学习人工智能计算机视觉

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_51426525/article/details/127722070

版权

论文专栏收录该内容

34 篇文章 2 订阅

订阅专栏

原文链接：MUSICAL: Multi-Scale Image Contextual Attention Learning for Inpainting (IJCAI 2019). Wang, N., Li, J., Zhang, L., & Du, B. [Paper]

本文创新点：

提出了一种多尺度注意力模块，通过合并不同大小patch的注意力模块产生的特征图，捕捉多个尺度的信息。

网络结构

网络整体以U-Net为基础，一次性修复图像。

Multi-scale Attention Module

本文采用两种不同大小的patch（3*3,1*1）来计算注意力分数。

首先计算缺失区域（foreground）和已知区域（background）的余弦相似度，

其次，通过softmax层得到注意力分数s* ；

然后，进行注意力传播；

最后，用反卷积操作得到重构特征图、，再将、与进行拼接。

为了确定当前图像中哪个层次的细节是最重要的，将拼接后的特征图输入到squeeze-and-excitation（SE）模块。最后，用像素卷积将特征图压缩到和输入相同的尺寸。

SE模块首先要计算特征图的平均池化值，然后利用全连接网络计算各个通道的权重。

整个模块可以用下式表示

损失函数

感知损失

利用VGG16的pool1, pool2 和 pool3计算感知损失

风格损失

总体损失

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。