GLUE(General Language Understanding Evaluation),为多任务的自然语言理解基准和分析平台。
GLUE的论文为:GLUE: A Multi-Task Benchmark and Analysis Platform for Natural Language Understanding
GLUE的官网为:https://gluebenchmark.com/
GLUE包含九项NLU任务。通常作为基准测试集测试各种模型。
自然语言处理(NLP)主要包括自然语言理解(NLU)和自然语言生成(NLG)
分别是CoLA、SST-2、MRPC、STS-B、QQP、MNLI、QNLI、RTE、WNLI。 可以分为三类,分别是单句任务,相似性和释义任务。所有任务都是单句或者句子对分类,除了STS-B是一个回归任务。
1 RTE
RTE(The Recognizing Text