论文阅读——Disentangled Image Matting

最新推荐文章于 2022-11-26 11:20:50 发布

Kiko1996

最新推荐文章于 2022-11-26 11:20:50 发布

阅读量347

点赞数

文章标签：深度学习人工智能计算机视觉神经网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Kiko1996/article/details/126744129

版权

摘要：论文认为以往的算法试图直接从粗糙的trimap估计出alpha matte，试图同时解决两个难题：识别trimap中的混合像素和估计准确的alpha。所以论文提出了AdaMatting，端到端的方法将上述问题分解成两个子问题：trimap适应问题和alpha估计问题。具体来看，trimap适应问题是像素级别通过识别特定前景和半透明图像区域来推断输入图片的整体架构的分类问题。而alpha估计问题是计算混合区域透明度的回归问题。

论文采用一个新颖的管道设计同时解决trimap适应的分类问题和alpha估计的回归问题。

1、 Trimap Adaptation

（x,y）表示图片的每个像素点。

论文中提到获取Topt包括两个步骤，一是根据alpha值确定背景或前景，二是计算不确定区域。同时提到相比于输入的trimap，我们的预测结果不需要完全匹配，该模型具有一定的容错能力。

2、Network Overview

AdaMatting以图片和对应的粗略trimap作为输入，首先经过encoder生成深度特征用于后续步骤，然后接下来是两个decoder，分别对应两个任务。每个decoder都是由多个3*3卷积和上采样模块构成。其中T-decoder（trimap classification task）输出3通道的分类结果，采用cross-entropy loss。而A-decoder（alpha regression task）输出一通道的alpha估计结果，用于传播模块来进行进一步调整。

Multi-task Autoencoder：

实验发现，trimap调整更依赖于高维特征，而alpha估计更依赖于低维特征，因为模型将encoder获得的高维特征和低维特征分别做了skip操作，分别直接连接到两个decoder上，这样也有利于保证感受野不会太小，计算复杂度又不会太高。

Propagation Unit：

利用lstm卷积网络，每个模块由两个resblocks和一个lstm构成。每次迭代都是以初始的输入图片、调整后的trimap结果和上一步生成的alpha估计作为输入。

3、 Multi-task Loss

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
论文阅读——Disentangled Image Matting

论文阅读——Disentangled Image Matting
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。