问题匹配(question matching)/Chinese Sentence Pair Classification:
1、AFQMC 蚂蚁金融语义相似度 Ant Financial Question Matching Corpus
1)Gitee库
数据量:训练集(34334)验证集(4316)测试集(3861)
例子:
{“sentence1”: “双十一花呗提额在哪”,
“sentence2”: “里可以提花呗额度”,
“label”: “0”}
2)蚂蚁金融NLP竞赛数据集
https://pan.baidu.com/share/init?surl=BIgFyK_kmJU4QwbLL82Hxg
5ig5
来源:https://blog.csdn.net/u014732537/article/details/81038260
(好像两个不是一个数据集)
2、BUSTM 小布助手对话短文本匹配数据集 XiaoBu Dialogue Short Text Matching
竞赛数据集
Gitee库:
eg:
{“id”: 5,
“sentence1”: “女孩子到底是不是你”,
“sentence2”: “你不是女孩子吗”,
“label”: “1”}