论文阅读——MODNet: Real-Time Trimap-Free Portrait Matting via Objective Decomposition

一、摘要

论文提出一个轻量级的抠图目标分解网络(MODNet)用于人物的实时抠图,且输入为单一图片,不需要提供诸如trimap的其他输入。主要改进在于通过显示约束同时优化一系列子目标。另外本论文有两个改进技术。一是融合了多尺度特征的语义估计e-ASPP。二是自监督的子目标一致策略。实验证明,速度够快,且该方法可运用于图片和视频。

二、方法

MODNet共分为几个分支。一是semantic estimation low-resolution branch S(语义估计 低分辨率分支S)。二是detail prediction high-resolution branch D(细节预测 高分辨率分支D)。三是semantic-detail fusion branch F(语义细节融合分支F)。这三个分支是同时进行优化,同时得到最终目标。

1、Semantic Estimation:用于人像定位。

采用encoder用于提取高维语义特征。主要有两个好处,一是参数少更高效,二是有利于后续分支的进行。论文中说到可采用随意的cnn作为backbone,为了速度更快采用了mobileNetV2,然后在为了会的单通道的Sp,将输出喂到sigmoid函数,并且采用

其中αg为gtrund truth matte,G表示高斯模糊后进行16倍的下采样。

在这部分还用到了eASPP。原因是MobileNetV2的预测结果不理想,ASPP虽然有效但是参数过多,eASPP示意图如下所示:

2、Detail Prediction

输入为I、S(I)和S的低维特征。论文采用如下三个方法来简化D的计算。一是D比S拥有更少的卷积层,实际数量为12个卷积层。二是D中的通道数更少,最大通道数为64。三是特征图的分辨率在第一层减少到原图的四分之一,并在最后两层恢复到原来的数量。而在操作过程中下采样的操作可以忽略,因为分支D采用了一个跳跃连接。

md是二分mask,是通过对alpha的ground truth进行膨胀腐蚀操作获得的。当像素点是在过渡区域时为1,否则为0。

3、Semantic-Detail Fusion

F分支直接采用CNN模块对前面的语义分支和细节分支进行结合。论文首先对S(I)进行上采样,然后将S(I)和D(I,S(I))进行concat操作。

论文中设置

三、SOC for Real-World Data

强制alpha p中的语义信息和s p保持一致,alpha p中的细节和d p保持一致,因此要求

再将M复制到M'

要求再执行SOC策略时的约束为

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
回答: 这个错误是由于OpenCV的imshow函数在显示图像时出现了断言错误。具体来说,断言失败的条件是图像的宽度和高度必须大于0。\[1\]类似的错误还有报错1和在运行MODNet时遇到的问题,都是由于无法找到指定扩展名的写入器。\[2\]\[3\]这些错误通常是由于图像文件的格式不受支持或者缺少相应的编解码器所致。要解决这个问题,可以尝试使用支持的图像格式,或者检查是否安装了正确的编解码器。 #### 引用[.reference_title] - *1* [opencv运行中遇到问题](https://blog.csdn.net/m0_53126906/article/details/126230834)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insertT0,239^v3^insert_chatgpt"}} ] [.reference_item] - *2* [多方面解析error D:\a\opencv-python\opencv-python\opencv\modules\imgcodecs\src \loadsave.cpp:692](https://blog.csdn.net/Ke_zs/article/details/128736115)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insertT0,239^v3^insert_chatgpt"}} ] [.reference_item] - *3* [成功解决cv2.error: OpenCV(4.7.0) D:\a\opencv-python\opencv-python\opencv\modules\imgcodecs\src\load...](https://blog.csdn.net/qq_52381360/article/details/129168524)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insertT0,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值