图像分割论文 “RANet : Region Attention Network for Semantic Segmentation”

最新推荐文章于 2022-12-07 17:03:39 发布

Najlepszy

最新推荐文章于 2022-12-07 17:03:39 发布

阅读量969

点赞数 1

分类专栏： LDR2HDR

本文链接：https://blog.csdn.net/Najlepszy/article/details/112210291

版权

语义分割问题比起像素级的关系，更依赖于目标级的关系，因此，本文提出利用目标区域来建立区域性的上下文，从而建立目标级的关系。RANet通过训练目标区域的构建、代表性区域内容的选取、信息通路的配置以及像素间的上下文交换，共同提高分割精度。

在本文中，作者提出了用对象区域来构建区域上下文的思想，它对对象层次的关系进行了建模。这里，区域指的是一个对象或一个部分。每个物体都可以看作是一个区域，由一组相邻的属于同一类别的像素组成。直观地说，对象区域的边界提供了对象之间的空间关系。在同一对象区域中，像素包含一致的类别信息。
在这里插入图片描述
如上图所示，RANet的RCB模块（Region Construction Block）可以联合分析boundary score map和semantic score map。通过计算图像中每对像素的region attention score，基于注意力得分，RCB计算每个像素（红点）的区域决策图（region decision map）。它使用区域决策图将图像划分为不同的目标区域。
之后，region decision map被传递到区域交互模块（Region Decision Map）。RIB选择每个区域内代表性像素，在同一区域内，每个代表像素从其他像素接收上下文。代表像素可以有效地表示对象区域的局部内容。另外，在不同的空间范畴中，不同的区域和代表性对象之间的关系是综合的。RIB产生全局上下文表示来增强像素，最终形成上下文特征图进行分割。
在这里插入图片描述
Region Construction Block
对于输入的特征图 $A\in\mathbb{R}^{H\times W\times M}$ ,通过两层卷积获得边缘图 $B\in\mathbb{R}^{H\times W}$ 和语义得分图 $C\in\mathbb{R}^{H\times W\times N}$ , $N$ 为类别数量。在同一个区域内，两个像素之间有较低的可能存在in-between boundary，并且有更高的可能属于同一个种类。
$D_{i,j}=\text{max}(B_{i\leftrightarrow j})$ , $B_{i\leftrightarrow j}$ 指的是像素i和像素j之间的线段上的点的boundary map的值，值越高说明越有可能是boundary。
之后，使用JS散度来计算两个像素i和j之间的相似度， $E_{i,j}$ 的值越低代表着像素i和像素j有可能是同一个种类。计算公式如下：
$E_{i,j}=\sum_{n=1}^N\frac{C_{i,n}\text{log}{C_{i,n}}+C_{j,n}\text{log}{C_{j,n}}}{2U_{i,j,n}}, U_{i,j,n}=\frac{C_{i,n}+C_{j,n}}{2}$
其中 $C_{i,n}$ 和 $C_{j,n}$ 代表着像素i和像素j每个种类的置信度。从而生成区域注意力图

最低0.47元/天解锁文章

Najlepszy

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
图像分割论文 “RANet : Region Attention Network for Semantic Segmentation”

语义分割问题比起像素级的关系，更依赖于目标级的关系，因此，本文提出利用目标区域来建立区域性的上下文，从而建立目标级的关系。
复制链接

扫一扫