[ICCV2019论文阅读]Efficient Segmentation: Learning Downsampling Near Semantic Boundaries

最新推荐文章于 2023-08-25 10:51:25 发布

gefeng1209

最新推荐文章于 2023-08-25 10:51:25 发布

阅读量2.1k

点赞数 1

分类专栏：医学图像分割

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/gefeng1209/article/details/102772375

版权

医学图像分割专栏收录该内容

14 篇文章 25 订阅

订阅专栏

背景

在语义分割任务中，常常会对输入图像进行下采样，下采样操作虽然带来了速度上的提升，但是却牺牲了细节上的精确度，本文证明均匀下采样是并不是最优的，并提出了一种由语义边界驱动的可选内容感知自适应下采样技术。本文的intuition是如果想要获得更多的分割质量，在下采样时需要考虑更多的使用靠近语义边界的像素。

非均匀下采样的优点：

1.通常的均匀下采样在原图像上进行边界精确定位更加复杂

2.非均匀采样隐式地通过减少较大分割图在下采样图像所占的部分和增加较小分割图在下采样图像所占的部分来考虑尺度变化。

方法

概述：分为3个部分

part1：非均匀下采样块，它被训练为对目标类的语义边界附近的像素进行采样

part2：使用现有的分割模型，对经过非均匀下采样块后的图像进行分割

part3：非均匀上采样块，对part2分割出的结果进行上采样，使得分割图的分辨率恢复到输入的原图大小

Boundary Driven Adaptive Downsampling

输入 $I=\left \{ I_{ij} \right \}$ 的size是H*W*C,假设我们将输入图像的所有像素坐标映射到 $\left [ 0,1 \right ]^2$ 网格坐标空间

$I\left [ u,v \right ]$ ：网格空间坐标(u,v)在输入图像中的最近邻位置的像素的值

$\phi \in\left [ 0,1 \right ]^{h*w*2}$ ： $\phi_{ij}^c,c\in\left \{ 0,1 \right \},i\in\left \{ 1,2,...,h \right \},j\in\left \{ 1,2,...,w \right \}$ 是我们需要学习的一个采样点横纵坐标构成的向量

训练方法：

从ground truth中根据语义标签计算出二值化的边界图，然后给每个像素坐标位置 $u_{ij}$ 计算其在边界上最邻近的坐标位置 $b\left ( u_{ij} \right )$

目标函数：

第一项：保证采样位置靠近语义边界位置

第二项：保证采样的空间结构不会过度的扭曲

约束条件：使得采样位置可以覆盖整张图像

第二项前的系数 $\lambda$ 取不同值时，采样点的分布情况如上图。

非均匀下采样块在均匀下采样减小输入图像分辨率后，通过附加网络(两个UNet)学习采样坐标位置 $\phi$ ，将 $\phi$ 的size恢复到目标图像大小，利用 $\phi$ 进行非均匀下采样

附加网络结构(double UNet)：

关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
2
评论
[ICCV2019论文阅读]Efficient Segmentation: Learning Downsampling Near Semantic Boundaries

背景在语义分割任务中，常常会对输入图像进行下采样，下采样操作虽然带来了速度上的提升，但是却牺牲了细节上的精确度，本文证明均匀下采样是并不是最优的，并提出了一种由语义边界驱动的可选内容感知自适应下采样技术。本文的intuition是如果想要获得更多的分割质量，在下采样时需要考虑更多的使用靠近语义边界的像素。非均匀下采样的优点：1.通常的均匀下采样在原图像上进行边界精确定位更加复杂2....
复制链接

扫一扫

专栏目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。