Graph-Based Global Reasoning Networks

最新推荐文章于 2022-04-12 21:47:12 发布

luputo

最新推荐文章于 2022-04-12 21:47:12 发布

阅读量5k

点赞数 2

分类专栏：论文笔记

本文链接：https://blog.csdn.net/luo3300612/article/details/90260233

版权

论文笔记专栏收录该内容

41 篇文章 3 订阅

订阅专栏

Graph-Based Global Reasoning Networks

原文地址

时间：2018

Intro

CNN擅长提取局部关系，但是在处理全局上的区域间关系时显得低效，且需要堆叠很多层才可能完成，如图所示，人类很容易能提取其中的关系，而对CNN来说却很难，因为CNN在最后几层才能有足够大的感受野，为了解决这个问题，本文提出了一个单元来直接进行global relation reasoning。

在这里插入图片描述

Contribution

提出了global reason的方法

Approach

overview

先把feature从coordinate space投影到latent interaction space，然后在interaction space使用图卷积网络来推理结点之间的信息，将这个信息和结点特征融合之后再反投影到coordinate space中

From Coordinate space to Interaction Space

$x_j\in R^{1\times C}$ 是原始特征 $X\in R^{L\times C}$ 中的一个特征，其中 $L=H\times W$ ， $C$ 是feature dimension，通过下式转化特征
在这里插入图片描述
其中 $B=[b_1,b_2,...,b_N]\in R^{N\times L}$ ，为了降低输入维数并增加投影函数的capacity，本文实现 $f (X)$ 为 $f(\phi(X;W_\phi))$ ， $B=\theta(X;W_\theta)$ ，其中 $\theta$ 和 $\phi$ 通过两个卷积层来建模，如图所示

Reasoning with Graph Convolution

将特征从coordinate space 投影到interaction space中之后，我们得到一张图，图中每个结点有一个特征，捕捉两个区域的关系现在简化为捕捉两个相应结点之间的关系。
为了捕捉两个结点之间的关系，直接的做法是concat，然后输入到小的神经网络里，但这样做破坏了两个向量之间存在的下标对应关系。因此我们的做法是将特征训练成全连接图的结点，通过学习边的权值来在全连接图上进行推理，因此我们使用了图卷积网络，定义如下
在这里插入图片描述
其中 $G$ 和 $A$ 是邻接矩阵， $A$ 被随机初始化，在训练中可以学习，单位矩阵是用来作为shortqcut connection以便降低优化的困难，这个过程如图所示

（b）图给出了两个不同方向的1维卷积——channel方向和结点方向

From Interaction Space to Coordinate Space

为了让上述步骤与CNN向兼容，需要将最后的输出投影回原来的空间，这样relation reasoning的结果可以提升CNN的表现。

给结点特征矩阵 $Z\in R^{N\times C}$ ，我们需要学习一个映射函数，将其映射到 $Y\in R^{L\times C}$ ： $Y = g (Z)$ ，与第一步相同，我们使用线性投影
在这里插入图片描述
实际中，可以通过第一步的变换来直接得到这里的变换，令 $D=B^T$

结论

本文指出了CNN在处理region relation的不足之处，提出了GloRe单元，通过将feature map 特征映射到图结点特征空间中，然后以图卷积网络提取并综合relation特征，最后返回到原空间的方法来弥补这一不足，可以将这个单元和别的网络结合起来。

问题

ResNet论文里指出，对于一层的skip connection其实没有意义，因为就是一个线性映射，那这里的skip connection还有什么用？

luputo

关注

2
点赞
踩
9

收藏

觉得还不错? 一键收藏
1
评论
Graph-Based Global Reasoning Networks

Graph-Based Global Reasoning Networks原文地址时间：2018IntroCNN擅长提取局部关系，但是在处理全局上的区域间关系时显得低效，且需要堆叠很多层才可能完成，如图所示，人类很容易能提取其中的关系，而对CNN来说却很难，因为CNN在最后几层才能有足够大的感受野，为了解决这个问题，本文提出了一个单元来直接进行global relation reasoni...
复制链接

扫一扫