NLP中各种常用数据集
GLUE数据集合1、 CoLA数据集CoLA(The Corpus of Linguistic Acceptability,语言可接受性语料库),单句子分类任务,语料来自语言理论的书籍和期刊,每个句子被标注为是否合乎语法的单词序列。本任务是一个二分类任务,标签共两个,分别是0和1,其中0表示不合乎语法,1表示合乎语法。样本个数:训练集8, 551个,开发集1, 043个,测试集1, 063个。任务:可接受程度,合乎语法与不合乎语法二分类。CoLA数据集的任务类型:二分类任务评估指标为: M
原创
2021-12-29 17:35:21 ·
7101 阅读 ·
0 评论