Alpha Matte Generation from Single Input for Portrait Matting阅读笔记

论文

一、简介

1.背景

传统的方法和大多数现有的工作利用了额外的输入,如三分图(ST-FAM那个),背景图像(BGM-V2),来预测alpha图。但提供额外的输入并不总是可行的,而且模型对这些额外的输入过于敏感。

2.方法

本文使用一种无额外输入且使用GAN的方法进行人像抠图。分为两个网络:一个分割网络用于生成粗略的人物分割mask和一个alpha生成网络用于alpha图预测。

3.贡献

  • 提供一种基于GAN的系统,在没有额外输入的情况下从任意输入图像产生alpha图
  • 将alpha图预测问题分成两个子任务,可以提高精度
  • 对粗略的分割图设计了独立的编码器,对分割模型预测的分割图进行编码可以提供更好的表示
  • 提出border loss来惩罚对象边界周围的误差,使用perceptual loss来比较特征空间中的预测和ground truth
  • 合并两个不同的训练数据集(AIM,Distinctions646),以提高图像的数量和多样性

4.结果

该方法优于同样采用单一输入的MODNet方法。同时获得了与需要额外输入的BGM-V2和FBA方法相当的结果。

二、网络结构

1.分割网络 

生成器网络:编码器,解码器以及残差块和ASPP模块。

鉴别器网络:使用原始图像和下采样2倍和4倍的图像组成图像金字塔,以获得相同图像的不同比例。

损失函数

  • adversarial loss:训练GAN
  • perceptual loss:计算对象是预测的分割图s和真实的分割图s^*通过VGG提取的所有特征,以及预测的前景对象F和真实前景对象F^*通过VGG提取的所有特征。

  • segmentation loss:计算预测分割图和地面真实分割图之间的绝对距离。
  • compositional loss (foreground loss):计算预测的和真实的前景对象之间的绝对距离。

       segmentation loss和compositional loss的组合如公式如下图所示:

  • border loss:s_b是下图d图所示的边界分割图,F_bF^*_b是边界前景对象。

 

 得到腐蚀分割图(a)和膨胀分割图(b)。然后相减得到边界分割图(d)。

2.alpha生成网络

生成器网络:一个编码器负责编码输入图像I以获得其特征图。另一个编码器负责编码由分割网络产生的粗略分割图s以获得其特征图;将两个编码器的输出相连,concat之后经过残差模块;最后经过解码器上采样输出最终的alpha图。其中skip-connection促使网络保留来自两个编码器的信息。

鉴别器网络:同分割网络。

 损失函数

adversarial loss:同分割网络(分割图s替换为alpha图\alpha)

perceptual loss :同分割网络(分割图s替换为alpha图\alpha)

alpha loss:

 border loss:

3.训练过程

 输入图像:1280 × 768

生成器学习率:10-4

鉴别器学习率:10-5

batch size:2 

优化器:Adam

三、实验

1.数据集

训练集:(AIM的201张+D646的363张)*COCO100张

测试集:(AIM的11张+PM85的85张+D646的11张)*VOC20张

2.定量评价

3.定性评价

 3.消融实验

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值