Matching Networks for one Shot Learning 阅读笔记

本文是关于Matching Networks在one-shot学习的应用的阅读笔记,介绍了该模型如何通过加权平均方法实现快速、小样本的训练。文章探讨了模型的优势,如使用set建模和注意力机制,以及面临的挑战,如新任务与训练数据分布差异大的问题。此外,还提到了content-based attention和set2set框架,并讨论了它们在解决向量集合相似度问题中的应用。
摘要由CSDN通过智能技术生成

Conclusion

parametric vs metric
karpathy很好的paper notes

Advantages
  1. 使用加权平均(metric)方法去做few-shot,优点: 速度快,需要训练量小
  2. 将对S的训练加入模型 pθ(y|x,S) p θ ( y | x , S ) ,具体做法是:分成task(或称为训练集)去训练, 每次选择一些类别L(label sets), 然后从中选取支持集S和batch进行训练
  3. 对f使用了set(unordered data)建模的方式
Disadvantages:
  1. 必须保证类别多?每个类别数据可以少。待验证
  2. 文末的几个questions
  3. 新的task和原有数据分布差异过大会有问题(论文中提出), 即 θ θ 分布不同
总结
  1. 一个可微分的end2end的KNN网络
  2. 重点在如何建模一个好的embedding函数(特征提取函数)
    • f: f(x̂ ,S) f ( x ^ , S ) , 基于set2set LSTM
    • g: g(xi,S) g ( x i , S ) , 基于bi-LSTM
      a
      b

Others

content based attention

Ref: 知乎过拟合的回答
建模一个向量和一个向量集合相似度的问题
从向量集合 v v 中选取一个和给定向量u相似的状态 v i

  • 方法一: 最邻近

    • 逐个计算相似度 ai a i ,从 v v 中选取和 u 最相似的 vi v i
    • 如果有大量相似度相近的 ai a i ,只选取一个 vi v i 只能保留一个向量,会丢失大量信息
  • 方法二: 平均

    • v v 中向量进行平均得到 v m ,计算最终相似度
    • 如果
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值