《(DEXTR)Deep Extreme Cut:From Extreme Points to Object Segmentation》论文笔记

本文介绍了交互式分割方法DEXTR,它利用极点引导进行目标区域分割。尽管方法简单,但选择极点和处理复杂形状的目标存在挑战。DEXTR采用ResNet-101加PSP模块的网络结构,并引入了平衡交叉熵损失来处理正负样本不平衡问题。此外,通过额外的第五个点策略提高分割精度。实验结果显示了方法的有效性。
摘要由CSDN通过智能技术生成

主页:dextr
参考代码:DEXTR-PyTorch

1. 概述

导读:这篇文章算是交互式分割种比较具有典型的了,在这篇文章中提出了一种使用极点作为引导,从而实现目标区域分割的方法。添加的引导不区分正负样本属性,只是去定义目标的边界,因而会在对应输入的卷积上添加1个channel就可以了。刚接触交互式分割的同学可以看看这篇文章,但是其也存在一些痛点问题。

文章的方法使用极点的形式作为引导,框出目标大致出现的位置,从而进行分割,其在一些图片上的结果见下图所示:
在这里插入图片描述
但是这样的方法在实际的过程中却存在下面的一些不足:

  • 1)极点在选择的时候也是很费劲的,需要去贴合目标的边界;
  • 2)对于一些包含/形状奇异的目标交互起来困难;
  • 3)文章虽然给出了使用额外第五个点的策略,但是整体上样本并不区分正负,妨碍交互式分割精度更进一步提升;

2. 方法设计

2.1 方法的pipline

文章的pipline比较简单,与传统的分割网络没有太大的差别,其使用的是ResNet-101(ImageNet Pretrained),之后添加PSP模块和解码单元,从而实现目标像素点的预测。其整体结构见下图所示:
在这里插入图片描述
文章的方法在输入进网络的时候会在裕度范围对目标进行剪裁,之后送入到网络进行预测。由于剪裁之后正负样本像素的比例变得异常,因而文章在原始交叉上的基础上给类别添加平衡因子,从而得到Balanced Cross Entropy Loss,为:
L = ∑ j ∈ Y w y j C ( y j , y j ^ ) L=\sum_{j\in Y}w_{y_j}C(y_j,\hat{y_j}) L

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值