CVPR2017论文:Deep Image Matting 地址:https://arxiv.org/pdf/1703.03872.pdf
1.主要内容:
给出图像 Input 和其三元图 trimap (一个蒙版包含:背景,前景,未知区域) ,利用深度学习计算图像alpha蒙版。该方法相比于其他方法,不仅仅只关注到颜色、位置等低层次信息,也关注到纹理、结构等高层信息。深度模型主要分为两部分:1)编码器-解码器网络结构( encoder-decoder network),该部分输入为原图和三元图,输出为图像alpha蒙版。2)小型优化结构,该部分为小型卷积网络对第一部分输出的图像alpha蒙版进行优化,使其边缘更加精确。
2.主体架构:
a)编码-解码结构:
输入为三通道图像Input和trimap组合成4通道数据,输出为未经优化的alpha蒙版。编码器部分为14×conv层和5×max pooling层进行下采样,解码器部分进行反向5×up pooling 和6×conv层进行上采样 。
该阶段采用了两个损失函数进行训练:
1)alpha预测损失函数。
该损失函数计算ground truth蒙版与预测的alph