Knowledge Graph Transfer Network for Few-Shot Recognition 阅读笔记

gltangwq

于 2021-05-03 10:50:41 发布

阅读量521

点赞数

文章标签：深度学习

本文链接：https://blog.csdn.net/gltangwq/article/details/116372711

版权

核心思想

小样本学习的挑战在于：识别新类别样本的过程容易受颜色、纹理、物体大小和背景的影响（特异性）。作者把与新样本相关的基类数据的语义标签信息迁移到新样本识别中，避免新样本的特异性影响，帮助小样本的学习，实现泛化到新样本。使用知识图建模了基类和新类别之间的相关性，提出了Knowledge Graph Transfer Network.

样本特征和分类器的关系

典型的分类模型由特征提取器 $\phi$ 和分类器 $f$ 组成。设输入为 $x_{im}$ ，预测的标签为 $\hat{y}={\argmax}_k \, f_k(x)={\argmax}_k \, p(y=k|x)$ ，其中

$\phi (x_{im}) \\ f_k(x) = {w_k}^{T}x + b_k \\ p(y=k|x)=\frac{e^{f_k(x)}} { \sum_{i=1}^{K} e^{f_i(x)}}$
$f_k(x)$ 为第 $k$ 个类别的分数， $w_k$ 为第 $k$ 个类别分类器对应的参数。

实验发现，样本特征 $x$ 和分类器 $w_k$ 具有相关性。
在这里插入图片描述

Few-Shot Image Recognition by Predicting Parameters from Activations这篇文章也有提到，见slide

理论解释
$f_k(x)={w_k}^{T}x+b_k=-\frac{1}{2}\|x-w_k\|^2 + \frac{1}{2}\|w_k\|^2 + \frac{1}{2}\|x\|^2 + b_k$
如果 $b_k=0$ ， $w_k$ 标准化，那么有
$\hat{y}={\argmax}_k \, f_k(x)={\argmax}_k \, -\frac{1}{2}\|x-w_k\|^2={\argmin}_k \, \|x-w_k\|^2$
即预测类别本质是在度量特征 $x$ 与分类器 $w_k$ 的相似性。

网络框架

在这里插入图片描述
整个网路由三个模块组成：知识图迁移模块、特征提取模块和预测模块。
知识图迁移模块：图的节点表示类别（基类+新类）的分类器权重，边表示标签的语义关系，使用GGNN模型传播信息，输出具有指导性的分类器权重。

训练过程

Stage1:基类数据上训练特征提取器，使用了 Squared Gradient Magnitude loss.
在这里插入图片描述

Stage2:固定特征提取器参数，使用1:1的比例抽取基类样本和新类样本，训练模型。损失函数如下

在这里插入图片描述

gltangwq

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Knowledge Graph Transfer Network for Few-Shot Recognition 阅读笔记

核心思想小样本学习的挑战在于：识别新类别样本的过程容易受颜色、纹理、物体大小和背景的影响（特异性）。作者把与新样本相关的基类数据的语义标签信息迁移到新样本识别中，避免新样本的特异性影响，帮助小样本的学习，实现泛化到新样本。使用知识图建模了基类和新类别之间的相关性，提出了Knowledge Graph Transfer Network.样本特征和分类器的关系典型的分类模型由特征提取器ϕ\phiϕ和分类器fff组成。设输入为ximx_{im}xim，预测的标签为y^=arg max⁡k fk(x)=ar
复制链接

扫一扫