目的
在文本分类中,经常碰到一些很少出现过的类别或这样不均衡的类别样本,而且当前的few-shot技术经常会将输入的query和support的样本集合进行sample-wise级别的对比。但是,如果跟同一个类别下的不同表达的样本去对比的时候产生的效果就不太好。
因此,文章的作者就提出了,通过学习sample所属于的类别的表示得到class-wise的向量,然后跟输入的query进行对比,这样能比state-of-the-art的模型提高3%正确率,同时泛化的效率也更高。
模型
模型分为三个模块:Encoder, Induction 和 Relation. 大概的架构如下图.
Data:
构建数据集的时候会把样本分为support set—S 和 query set — Q,support set就是用来训练参数的,query set就是用来模拟真实请求,计算loss的;
support set是从C个Class中,每个class抽出K个样本生成的,那么在C个class中剩余的部分就作为query set.
Encoder Module:
Encoder阶段就是将support set的文本进行encoding; 首先,会经过Bi-LSTM得到这样句子的表示;
假如:support set的样本是m (m=C * K),LSTM输出的表示的维度是u的话,经过Bi-LSTM会得到H,其维度为(m, T, 2u).