fewshot意图识别

本文探讨Few-Shot Text Classification,介绍Induction Network的应用,通过编码器、动态学习和关系抽取处理少量样本的分类任务。在训练集上,模型学习通用表示,而在测试集上,面对新类别时,模型直接利用已学习的表示进行匹配。复现过程中遇到数据集划分、Capsule网络理解和训练策略等问题,需进一步优化以提高损失函数收敛速度和准确性。
摘要由CSDN通过智能技术生成

Few-Shot Text Classification with Induction Network
代码地址:

meta learning:
每一个training episode,在training set中选择C个classes,
在每个class下选择training data(样本环境)和testing data(即为query),
这C个classes的所有training data构成 support set,这C个classes的所有testing data构成query set。
meta testing:
这里面的样本,每个class的样本数很少,而且所有的class在之前的learning中没有见过,
我们用同样的方法选择出support set和query set,验证判断情况。

取自FEW-SHOT TEXT CLASSIFICATION WITH Distributional signatures19,
那么每次的query set 一共有C*len(testing data)个,逐一与classes进行比较。

总结:
1.
在training set上,
encoder学会句子(query和classes里面所有句子的共同表示),
dynamic 学会classes表示
relation学会抽取class-query的匹配信息,
2.
testing set,就是class很少而且class样本很少,不用纠结testing 的定义问题,只是问了判断training的性能。不用继续训练,直接看loss,
当新的classes来的时候,dynamic可以直接提取class表示,
3.
当实际应用时,我们已经提取出所有classes的表示,每来一个query,与所有的class表示进行relation计算,得到分数最高的,


复现问题:

1.learning 和test的数据集的划分问题:

5C5K,5C10K,10C10K,
2.
在test阶段,还是有support set和query set,就是说每个query_text都是有候选集的.而我在test之后需要进行准备好所有的classes_vectors。
文章主要解决的问题是,来了样本条数少的新种类,怎么办。
3.重读文章的理论内容,(已做笔记)
4.对于capsule部分,
论文里仅有的参数是 e i j = W s

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值