Matching Networks for One Shot Learning论文

最新推荐文章于 2021-08-14 17:36:06 发布

csCaiRujia

最新推荐文章于 2021-08-14 17:36:06 发布

阅读量439

点赞数

分类专栏： few-shot 论文

本文链接：https://blog.csdn.net/Dream_xd/article/details/105536532

版权

该论文提出了一种名为Matching Networks的模型，用于一拍即合（one-shot）学习，结合了参数化模型的深度学习能力与非参数模型的快速适应性。通过使用外部记忆增强的神经网络，模型在无需微调的情况下即可对新类别数据进行分类。关键创新点包括全上下文嵌入和特定于one-shot学习的训练策略，使得模型能够在不同任务间迁移知识。

摘要由CSDN通过智能技术生成

论文：Matching Networks for One Shot Learning
来源：NIPS2016
地址：https://arxiv.org/abs/1606.04080v2
code:https://github.com/oscarknagg/few-shot

摘要

在这篇文章里我们应用了基于深度神经特征 metric learning 的想法，利用外部的记忆的增强（augment）神经网络。论文中提出的网络对于新的类别数据不需要进行fine-tune。

引言

参数化的模型往往需要大量的样本去训练他们的参数完成样本的吸收，相反，许多非参数化的模型可以快速的吸收样本，但是他们往往依赖于选择的度量，过去的关于 metric learning 的工作影响了我们的模型，我们的目的是整合参数和非参数模型最好的特征。

我们的工作有两个创新点：模型层面和训练层面。模型方面我们提出了 matching nets（MN）；第二就是测试和训练的环境必须匹配。

模型

我们的非参数化模型有俩部分，首先，给定（small）支持集 S，模型为每个 S 定义分类器 $\rightarrow c_s(\cdot)$ ，第二我们应用一个专门用于 one-shot learning 的训练策略。
MN模型结构

模型架构

我们的贡献是提出了 set-to-set 框架，关键点是当训练时，matching network 能够为 unobserved class 产生合理的测试标签，且不用网络做任何改变。我们希望将一个有着 k 个样本图像-标签对 $S = \{(x_i,y_i)\}_{i=1}^k$

最低0.47元/天解锁文章

csCaiRujia

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
Matching Networks for One Shot Learning论文

文章目录摘要引言模型模型架构Full Context EmbeddingsThe Fully Conditional Embedding fThe Fully Conditional Embedding gTraining StrategyRelated work实验ImageNet参考论文：Matching Networks for One Shot Learning地址：https://...
复制链接

扫一扫

专栏目录