Interactive Full Image Segmentation (CVPR2019)

JYZhang_sh

于 2019-09-03 21:22:09 发布

阅读量1k

点赞数 1

分类专栏：机器学习深度学习文章标签：交互式分割深度学习全景分割

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/jyzhang_cvml/article/details/100526649

版权

机器学习同时被 2 个专栏收录

44 篇文章 7 订阅

订阅专栏

33 篇文章 3 订阅

订阅专栏

在这里插入图片描述

Full Image Segmentation 问题定义

全图分割的目标是把一张图中所有的物体 (all objects) 和背景 (stuff regions) 分割出来。
在这里插入图片描述

Workflow

在这里插入图片描述
首先用基于极端点的分割得到初始分割结果，然后用 scribbles 进行交互式修正。

Contribution and Advantage (明确在Full Image Segmentation中)

考虑在全图分割的任务中，标注者关注整张图中最大错误的地方，而不是给定类别的最大错误的地方 —— 基于 Mask-RCNN 的全图交互式分割框架。
交互可以在不同类别物体之间共享 —— 有效的 annotation 编码和 concat 方式。
确保区域在图像域中具有 compete for space 的效果 —— pixel-wise instance-aware loss function。
相比如 FCN-style 的交互式分割框架，这种 Mask-RCNN 框架更加节省计算资源。

算法

在这里插入图片描述

算法框架

输入：图像，每一类物体对应的annotation map (由极端点和交互涂抹得到)，每一类物体对应的 box (由极端点得到)。
和 Mask-RCNN 的区别，由于可以直接通过极端点得到 bounding box，因此不用 RPN 来进行 bbx proposal。
考虑每一类之间相互影响，因此 canvas projection 将 ROI feature 得到的结果反投影到原图上，然后计算 sigmoid 得到概率：

Annotation Map

在这里插入图片描述
对于每个区域，

首先生成和原图大小相同的二值的 positive annotation map $S_i$ ，直接用对应该区域的极端点和修正涂抹生成。
negative annotation map 直接将所有和该区域无关的内容求和。
然后 concatenate 上述两种 annotation map 得到最终结果：
然后再采用 RoI-align 对 $F_i$ 进行裁剪。

注意：这样构建 annotation map 的方式能够使得交互信息在不同 region 和 stuff 之间共享。

Instance-aware Loss Function

在这里插入图片描述

总结

这篇文章着眼于全图分割这个任务，因此衍生出如何利用 multi-objects 和 stuff regions 之间的关系 —— 这一重要问题。因此才有了 Mask-RCNN 的框架来联合处理 ( annotation map 的生成和 re-projection 都联合了不同 objects 之间的关系)。
另外，这个框架也值得玩味：类似于先生成 initial segmentation（这里是采用极端点的方式），然后做修正（scribble-based）。

关注

1
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

JYZhang_sh

CSDN认证博客专家 CSDN认证企业博客

码龄8年

59: 原创

2万+: 周排名

178万+: 总排名

25万+: 访问

: 等级

2848: 积分

217: 粉丝

188: 获赞

112: 评论

663: 收藏

私信

关注

热门文章

分类专栏

最新评论

深度学习如何估计模型不确定性(epistemic uncertainty)
不服不行咔咔咔: 模型的不确定性即为认知不确定性，通过预测结果的方差进行度量，那如果模型的输出定位为正态分布，其sigma为度量任意不确定性，这样都是方差的话，岂不是认知不确定性和任意不确定性的量化是一样的嘛？
深度学习如何估计模型不确定性(epistemic uncertainty)
撸破天: 数据的不确定性的产生主要是因为测量精度的限制、外界噪音的干扰，甚至有的场景下，数据完全是由随机过程产生的。回归任务，非概率模型，对于某一个样本sample，模型的输出是一个确定的值y，一个确定的值就没有不确定性的概念了，所以需要把输出定义为一个概率分布，就可以去衡量不确定性了。比如回归任务，可以把模型的输出定义为一个正太分布，正态分布的参数分别是均值miu和标准差sigma，对于某一个样本，模型的输出就不是一个确定的值了，而是一个服从N(miu, sigma)的概率分布了，通过sigma就可以直接来衡量不确定程度了，95%的置信区间就是[miu-1.96*sigma, miu+1.96*sigma].
深度学习如何估计模型不确定性(epistemic uncertainty)
liubinhong: 您好，既然任意不确定性说的是数据的不确定性，为什么不直接建模输入数据的不确定性而要把模型的输出建模成一个概率分布呢
深度学习如何估计模型不确定性(epistemic uncertainty)
撸破天: 标准的神经网络的参数的估计是最大似然估计MLE，MLE是一个点估计，得到的参数是固定的值，而贝叶斯神经网络参数的估计应该是最大后验估计MAP，如果采用变分推断的话，每一个参数都不是固定的值，而是一个概率分布，预测的时候，相当于从这个概率分布中随机抽一个样本进行计算，所以模型每次的输出都是不一样的，所以就可以通过预测结果的方差来衡量不确定性！
深度学习如何估计模型不确定性(epistemic uncertainty)
撸破天: 任意的不确定性也就是数据的不确定性，需要把模型定义为一个概率模型：模型的输出是一个概率分布！比如，回归任务可以把模型的输出定义为一个正太分布，正太分布是一个双参数的概率分布，分别是均值miu和标准差sigma，将模型的倒数第二层设置为两个节点，没有激活函数，分别输出miu和sigma，但是对于sigma，还需要进行sigma = tf.nn.softplus(sigma)的操作，确保sigma是正值，再将模型的输出层定义为一个正太分布就行了，模型需要从数据中去学习正太分布的miu和sigma。如果MC Dropout或者变分推断VI的方法实现神经网络，再将模型的输出层也定义为一个概率分布，那么模型就可以同时捕获数据的不确定性和模型的不确定性了！

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。