Out-of-Domain Detection for Low-Resource Text Classification Tasks 论文解读

介绍

we propose an OODresistant Prototypical Network to tackle this zero-shot OOD detection and few-shot ID classification task.
设计一种OOD-限制的原型网络去解决0样本OOD检测和少样本ID数据分类任务。

相关知识

OOD检测

阐述了OOD检测的俩种思路,1.将OODtask定义为一个类目的分类问题,后使用SVM或者深度模型去解决 2提出基于auto-encoder方法解决。也有人同时使用ID分类和OOD检测,但没有运用在少数据的环境下,这也是本文的一大亮点。

少样本学习

少样本学习可以同时满足OOD检测和ID分类任务。目前在cv领域使用的少样本学习的方法包括:1.使用度量标注学习,具体指在输入样本间构建好的相似度度量标准;2.合理使用元学习框架,并使用梯度下降法,运用在新的数据上,去解决ood问题。
也有一些方法可以运用去解决nlp问题,包括文本分类、关系抽取等。

方法

模型

在这里插入图片描述
核心就是:
1.模型框架基于原型网络
2.encoder方式采用一般的cnn或者lstm即可
3.三组重要的数据包括s集、Xin、Xout分别对应support集合、训练输入集合、ood集合,后使用encoder解析成向量,在构建一个合理的LOSS 进行反向传播。

在这里插入图片描述
在这里插入图片描述

框架

具体可见原论文,这里主要分成以上7步。
粗略的表述就是:先构建训练样本、ood样本,通过encoder方式将样本转化成向量,再构建合理的损失函数,进行训练,达到ood检测和ID分类任务。

损失函数

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
以上公式1是标准原型网络的损失函数,可以用来实现ID分类任务,但无法解决ood 检测,所以考虑加入公式2的荷叶损失函数,但加入Lood后,会让模型更关注ood数据,而忽略ID,所以加入了Lgt损失,构成了最终四式的损失函数

训练数据和试验

主要采用Amazon Review和Conversation Dataset训练数据,考虑ood和Low-Resource情况,模型效果。
对比四个基础模型,paper中的这个思路在2个测试集上的指标效果都有提升。

结论

本篇基于原型网络思想,加上一些参数,实现模型可以同时解决ood问题和ID分类问题,更重要的是训练数据都特别稀少,同时效果仍然可观,妙!
可以借鉴的点:
1.OOD问题在已有模型(原型网路)上是如何加入的
2.OOD和ID分类问题可以同时解决的新思路

链接

https://github.com/SLAD-ml/few-shot-ood

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值