论文阅读——Disentangled Image Matting

摘要:论文认为以往的算法试图直接从粗糙的trimap估计出alpha matte,试图同时解决两个难题:识别trimap中的混合像素和估计准确的alpha。所以论文提出了AdaMatting,端到端的方法将上述问题分解成两个子问题:trimap适应问题和alpha估计问题。具体来看,trimap适应问题是像素级别通过识别特定前景和半透明图像区域来推断输入图片的整体架构的分类问题。而alpha估计问题是计算混合区域透明度的回归问题。

论文采用一个新颖的管道设计同时解决trimap适应的分类问题和alpha估计的回归问题。

1、 Trimap Adaptation

(x,y)表示图片的每个像素点。

论文中提到获取Topt包括两个步骤,一是根据alpha值确定背景或前景,二是计算不确定区域。同时提到相比于输入的trimap,我们的预测结果不需要完全匹配,该模型具有一定的容错能力。

2、Network Overview

AdaMatting以图片和对应的粗略trimap作为输入,首先经过encoder生成深度特征用于后续步骤,然后接下来是两个decoder,分别对应两个任务。每个decoder都是由多个3*3卷积和上采样模块构成。其中T-decoder(trimap classification task)输出3通道的分类结果,采用cross-entropy loss。而A-decoder(alpha regression task)输出一通道的alpha估计结果,用于传播模块来进行进一步调整。

Multi-task Autoencoder:

实验发现,trimap调整更依赖于高维特征,而alpha估计更依赖于低维特征,因为模型将encoder获得的高维特征和低维特征分别做了skip操作,分别直接连接到两个decoder上,这样也有利于保证感受野不会太小,计算复杂度又不会太高。

Propagation Unit:

利用lstm卷积网络,每个模块由两个resblocks和一个lstm构成。每次迭代都是以初始的输入图片、调整后的trimap结果和上一步生成的alpha估计作为输入。

3、 Multi-task Loss

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值