论文解读: Few-Shot Text Classification with Induction Network

本文深入解析了一种改进的Few-Shot文本分类方法,通过归纳网络实现class-wise向量学习,增强样本间对比,提高分类准确率。模型包含Encoder、Induction和Relation模块,尤其在处理类别不平衡和新类别识别上展现出优越性能。
摘要由CSDN通过智能技术生成
目的

在文本分类中,经常碰到一些很少出现过的类别或这样不均衡的类别样本,而且当前的few-shot技术经常会将输入的query和support的样本集合进行sample-wise级别的对比。但是,如果跟同一个类别下的不同表达的样本去对比的时候产生的效果就不太好。
因此,文章的作者就提出了,通过学习sample所属于的类别的表示得到class-wise的向量,然后跟输入的query进行对比,这样能比state-of-the-art的模型提高3%正确率,同时泛化的效率也更高。

模型

模型分为三个模块:Encoder, Induction 和 Relation. 大概的架构如下图.
在这里插入图片描述

Data:
构建数据集的时候会把样本分为support set—S 和 query set — Q,support set就是用来训练参数的,query set就是用来模拟真实请求,计算loss的;
support set是从C个Class中,每个class抽出K个样本生成的,那么在C个class中剩余的部分就作为query set.
Encoder Module:
Encoder阶段就是将support set的文本进行encoding; 首先,会经过Bi-LSTM得到这样句子的表示;
假如:support set的样本是m (m=C * K),LSTM输出的表示的维度是u的话,经过Bi-LSTM会得到H,其维度为(m, T, 2u).

  • 2
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值