-
CoLA:
单句的二分类问题, 判断一个英文句子在语法上是不是可接受的. -
SST-2
单句的二分类问题, 句子的来源于人们对一部电影的评价, 判断这个句子的情感. -
MRPC
句子对来源于对同一条新闻的评论. 判断这一对句子在语义上是否相同. -
STS-B
这是一个类似回归的问题. 给出一对句子, 使用1~5的评分评价两者在语义上的相似程度. -
QQP
这是一个二分类数据集. 目的是判断两个来自于Quora的问题句子在语义上是否是等价的. -
MNLI-m
语型内匹配。推断两个句子是意思相近, 矛盾, 还是无关的 -
MNLI-mm
跨语型匹配。推断两个句子是意思相近, 矛盾, 还是无关的 -
QNLI
也是一个二分类问题, 两个句子是一个(question, answer)对. 正样本为answer是对应question的答案, 负样本则相反 -
RTE
是一个二分类问题, 类似于MNLI, 但是数据量少很多 -
WNLI: 推断两个句子是意思相近, 矛盾, 还是无关的
-
AX: QA型图像数据库
参考: