Learning Attentive Pairwise Interaction for Fine-Grained Classification论文解读

最新推荐文章于 2022-10-11 16:37:20 发布

WangKingJ

最新推荐文章于 2022-10-11 16:37:20 发布

阅读量2.7k

点赞数 7

分类专栏：计算机视觉文章标签：计算机视觉图像识别人工智能深度学习

本文链接：https://blog.csdn.net/WangKingJ/article/details/105469692

版权

论文链接：https://arxiv.org/abs/2002.10191

分享的这篇文章来自于AAAI2020，文章的整个思路并不难理解。文章的idea来自于我们人类对相似图像的识别。一般来说，我们识别相似的图像，一方面是去找到图像中特殊的区域来进行识别，另一方面是通过比较图像对来有效地得到对比线索。这篇论文就是从后者获得的灵感。
文章提出了Attentive Pairwise Interaction Network (API-Net)，该网络可以通过交互逐步识别一对细粒度的图像。

思维导图
在这里插入图片描述

Model

在这里插入图片描述
整个的网络如上图所示，简单说一下流程如下：

在训练阶段，输入一对图像对到backbone中，分别提取特征，得到对应的特征向量 $x_1,x_2$ ，然后我们得到一个 mutual vector $x_m\in \Bbb{R}^{D}$
我们将 $x_m$ 与 $x_i$ 按通道进行点乘，即用 $x_m$ 查找哪个通道可能包含对比线索，然后再通过sigmoid函数，得到gate vector $g_i\in \Bbb{R}^{D}$
然后再gate vector 的指导下进行成对的交互，交互后的向量放入softmax classifier中得到损失函数。

上图中的黄色部分是网络的核心部分， Attentive Pairwise Interaction（API），它是一个即插即用的模块，只在训练的过程中存在，在测试的时候，单图像进行测试，图像通过backbone提取特征向量之后，直接放入softmax classifier中，得到得分向量用于标签预测。

Attentive Pairwise Interaction（API）

这是网路的核心部分，但是并没有很复杂，它主要由三部分组成。

Mutual Vector Learning.
Gate Vector Generation.
Pairwise Interaction

下面详细的介绍一下这三个部分，以更好的来理解文章（个人拙见，有不完备的地方还请路过的大佬指教）。

Mutual Vector Learning. 这是一个很简单的部分，输入一对图像到back

最低0.47元/天解锁文章

WangKingJ

关注

7
点赞
踩
18

收藏

觉得还不错? 一键收藏
7
评论
Learning Attentive Pairwise Interaction for Fine-Grained Classification论文解读

分享的这篇文章来自于AAAI2020，文章的整个思路并不难理解。文章的idea来自于我们人类对相似图像的识别。一般来说，我们识别相似的图像，一方面是去找到图像中特殊的区域来进行识别，另一方面是通过比较图像对来有效地得到对比线索。这篇论文就是从后者获得的灵感。文章提出了Attentive Pairwise Interaction Network (API-Net)，该网络可以通过交互逐步识别一对细...
复制链接

扫一扫