【论文分享】PET：Exploiting Cloze Questions for Few Shot Text Classification and Natural Language Inference

vector<>

已于 2022-02-16 11:41:20 修改

阅读量3.4k

点赞数 2

分类专栏： # Prompt 文章标签：深度学习机器学习计算机视觉

于 2022-01-25 11:22:29 首次发布

本文链接：https://blog.csdn.net/qq_39328436/article/details/122669092

版权

8 篇文章

订阅专栏

论文链接：https://arxiv.org/pdf/2001.07676.pdf
时间：2021年1月
特点：多模板

目录

背景
模型
PVP定义
组合PVP
P:
V：

结构

实验

背景

在小样本场景下传统监督学习效果很差，于是提出了模型PET（Pattern-Exploiting Training）它是一种半监督训练过程，使用自然语言模板将输入的示例重新组织成完形风格的短语。

符号定义：

有标注小样本数据集：T
无标注大型数据集：D
语言模型：M
词表：V
掩码标记：___
分类任务：A
标签：L
输入：短语序列 x = (s1, . . . , sk)

在详细介绍模型之前需要先介绍一个概念 PVP

Pattern-Verbalizer-Pair

定义函数P（pattern）：输入x，输出包含掩码标记的句子或短语，使得输出可以被看作是一个完形填空问题。可以理解为“模板构造”。输入x=“Best pizza ever!” P(x)="Best pizza ever! It was___.”
映射V（verbalizer）：将PLM预测标签映射为词表中的一个单词。比如预测结果为负向标签0，继续将0映射为单词“bad”，可以理解为“答案映射”的逆过程。

在学习prompt的过程中，最后一步答案映射是将预测词映射为标签词，这里的verbalizer是逆过程，对于两者的区别，我的理解是verbalizer侧重于训练过程，答案映射侧重于预测过程。

通过之前对prompt的学习我们知道，模板构造，答案映射，是prompt-tunning中非常关键的两个环节。对于同一个任务，可以设计不同的模板，也可以设计不同的答案映射器，这会带来不同的效果。因此需要进一步讨论组合PVP的概念。

针对不同的分类任务以及数据集，论文提出了多种建议的PVP组合，下文仅以情感分类任务为例继续介绍。

在这里插入图片描述
对于情感分类，论文提出了四种建议的模板。以P3为例，假设输入a=“Best pizza ever”, 构造的模板P3(a)=“Best pizza ever.All in all, it was__”。

在这里插入图片描述
标签1映射为单词terrible，标签2映射为单词bad

从上面这个例子也能看出来，PET中模板以及映射都是手工创建的，特殊的是有多个PVP组成PVPs，也就是在综述论文中提到的多模板组合。

在这里插入图片描述

在这里插入图片描述
为了达到更好的效果，进一步提出了iPET，上图中123为PET结构，123abc为iPET结构

数据集：Yelp Reviews, AG’s News, Yahoo Questions，MNLI ，X-Stance（使用x-stance 来研究PET在其他语言中的效果）
语言模型：英文实验（RoBERTa large），x-stance（XLM-R）
试验任务：情感分类，主题分类，答案匹配，句子匹配

英文数据集精度与方差：
在这里插入图片描述
无论小样本数据集为多大，iPET都能达到SOTA。