论文解读: Few-Shot Text Classification with Induction Network

最新推荐文章于 2024-05-13 20:57:31 发布

Alex_Cen

最新推荐文章于 2024-05-13 20:57:31 发布

阅读量1.6k

点赞数 2

分类专栏： NLP 论文分享文章标签： NLP 论文解读

本文链接：https://blog.csdn.net/mp43ily/article/details/101624878

版权

本文深入解析了一种改进的Few-Shot文本分类方法，通过归纳网络实现class-wise向量学习，增强样本间对比，提高分类准确率。模型包含Encoder、Induction和Relation模块，尤其在处理类别不平衡和新类别识别上展现出优越性能。

摘要由CSDN通过智能技术生成

目的

在文本分类中，经常碰到一些很少出现过的类别或这样不均衡的类别样本，而且当前的few-shot技术经常会将输入的query和support的样本集合进行sample-wise级别的对比。但是，如果跟同一个类别下的不同表达的样本去对比的时候产生的效果就不太好。
因此，文章的作者就提出了，通过学习sample所属于的类别的表示得到class-wise的向量，然后跟输入的query进行对比，这样能比state-of-the-art的模型提高3%正确率，同时泛化的效率也更高。

模型

模型分为三个模块：Encoder, Induction 和 Relation. 大概的架构如下图.
在这里插入图片描述

Data:
构建数据集的时候会把样本分为support set—S 和 query set — Q，support set就是用来训练参数的，query set就是用来模拟真实请求，计算loss的;
support set是从C个Class中，每个class抽出K个样本生成的，那么在C个class中剩余的部分就作为query set.
Encoder Module:
Encoder阶段就是将support set的文本进行encoding; 首先，会经过Bi-LSTM得到这样句子的表示;
假如:support set的样本是m (m=C * K)，LSTM输出的表示的维度是u的话，经过Bi-LSTM会得到H，其维度为(m, T, 2u).

最低0.47元/天解锁文章

Alex_Cen

关注

2
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
论文解读: Few-Shot Text Classification with Induction Network

目的在文本分类中，经常碰到一些很少出现过的类别或这样不均衡的类别样本，而且当前的few-shot技术经常会将输入的query和support的样本集合进行sample-wise级别的对比。但是，如果跟同一个类别下的不同表达的样本去对比的时候产生的效果就不太好。因此，文章的作者就提出了，通过学习sample所属于的类别的表示得到class-wise的向量，然后跟输入的query进行对比，这样能比...
复制链接

扫一扫

专栏目录