AI抠图算法总结

「已注销」

已于 2022-11-09 09:43:09 修改

阅读量4.2k

点赞数 2

分类专栏： CV 文章标签：人工智能算法深度学习

于 2022-10-08 23:00:02 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zxdd2018/article/details/127143250

版权

文章目录

1. 预备知识
1.1 问题定义
1.2 Trimap（三元图）
2. 算法总结

1. 预备知识

1.1 问题定义

图像由前景和背景组成，抠图的感兴趣区域是前景（比如人像），目的是将前景和背景分离，用公式表达如下： $I_i=\alpha_i F_i+(1-\alpha_i)B_i \qquad (1.1)$ 其中： $i$ 表示像素索引， $F$ 表示前景， $B$ 表示背景， $\alpha$ 表示像素属于前景的概率，取值范围为0~1（人像分割任务中的 $\alpha$ 取值为0或1）

1.2 Trimap（三元图）

在这里插入图片描述
（图片来源：论文 Deep Image Matting）

三元图是对原始图片的前景、背景和未知区域进行标记的灰度图，前景、背景和未知区域的像素取值分别为255，0，128。三元图通常作为抠图算法的先验知识。

2. 算法总结

这里只对经典或者效果好的AI抠图算法进行总结，根据是否需要先验信息可分为trimap-based，background-based和trimap-free两类，目前的主流是trimap-free算法。

2.1 Trimap-based Algorithms

2.1.1 Deep Image Matting （2017）

Paper：https://arxiv.org/pdf/1703.03872.pdf
Code：https://github.com/foamliu/Deep-Image-Matting-PyTorch

在这里插入图片描述
网络包括Encoder-Decoder阶段和Refinement阶段：

Encoder-Decoder阶段的输入为RGB图像的patch和对应trimap的concat，所以包含4通道，经过编码和解码后输出单通道的raw alpha pred。该阶段的loss由两部分组成：
第一部分是预测的alpha和真实的alpha之间的绝对误差，考虑到L1 loss在0处不可微，使用Charbonnier Loss去近似： $L_{\alpha}^{i}=\sqrt{(\alpha_{p}^{i}-\alpha_g^i)^2+\epsilon^2}\qquad(2.1.1.1)$

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。