《HOP-Matting:Hierarchical Opacity Propagation for Image Matting》论文笔记

本文介绍了HOP-Matting算法,一种基于多层次不透明度传播的方法,用于图像 matting。该方法通过全球和局部HOP模块优化像素间的不透明度传导,解决了传统方法在高分辨率特征图上的问题。文章详细阐述了网络结构、HOP模块的设计,包括全局和局部注意力机制,并提到了尺度不敏感的编码和数据增强策略,以适应不同尺寸的输入图像。
摘要由CSDN通过智能技术生成

参考代码:HOP-Matting

1. 概述

导读:现有的一些深度学习的matting方法是基于propagation的,这篇文章对此提出了多层次不透明度propagation(hierarchical opacity propagation,HOP)的方法,用于像素之间的不透明度传导。文章的HOP结构具有一个global和多个local的propagationmo模块,从而使得高分辨特征图下的每对像素点可以根据输入图像的外表特征连接起来。此外文章还提出了一种尺度不敏感的编码方式用于解决非固定尺度的图片输入,并且引入随机插值的方式进行数据增广。

这篇文章的核心是提出了一个HOP网络结构,使得需要预测的alpha在不同的特征层级上使用这个结构进行优化。HOP结构在文章中按照感受野的不同可以将其划分为global HOP和local HOP,HOP模块中借用了attention与aggregation机制完成信息的迁移,因而这里处理的是matting目标的外表特征与对应的不透明度。

文章中global HOP与local HOP在网络中扮演着不同的角色,global HOP用于在低分辨率但具有较强语义信息特征下通过上下文信息预测不同明度,之后local HOP去优化网络中细节的模糊部分。另外通过尺度不敏感的编码器与随机插值缩放算法从而适应不同尺寸的图像输入,并且数据数据增广。文章的结果与之前的一些工作进行对比,见下图所示:
在这里插入图片描述

2. 方法设计

2.1 网络结构

文章提出的网络结构见下图所示:
在这里插入图片描述
在a图中展示的是这篇文章的网络结构,其主要由两个编码器(不透明度信息编码器和图像外观编码器)加一个解码器组成。b图展示的是在文章的不同模块上进行不透明度传递的示意图。

non-local和transformer可以在全局上完成信息的传导,但是文章需要的信息传递与之有些不同:

  • 1)non-local首先会消耗较多的内存与计算资源,并且它并不适合在大分辨率的特征图上进行信息传递,但这确是对matting比较重要的;
  • 2)non-local是单独作用在输入数据上的,而在matting任务中更为重要的是不透明度信息,而不是像分类/分割/inpainting中,这些任务中更加侧重网络的语义表达,这与matting任务并不相兼容;

2.2 HOP模块

global HOP:
这里定义从不透明度编码器和图像外观编码器输出的特征图是: F O ∈ R H W ∗ C , F A ∈ R H W ∗ C F^O\in R^{HW*C},F^A\in R^{HW*C} FORHWC,FARHWC,其中特征在每个特征点在位置 ( i , j ) (i,j) (i,j)处其点特征描述为: f ( i , j ) O ∈ R C , f ( i , j ) A ∈ R C f_{(i,j)}^O\in R^C,f_{(i,j)}^A\in R^C f(i,j)ORC,f(i,j)ARC,因而在global HOP模块中其运算过程描述为:

q ( i , j ) = W Q K f ( i , j ) A q_{(i,j)}=W_{QK}f_{(i,j)}^A q(i,j)=WQKf(i,j)A
k ( x , y

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值