BERT破的11项纪录具体都是什么？

最新推荐文章于 2024-06-12 09:55:29 发布

Jeu

最新推荐文章于 2024-06-12 09:55:29 发布

阅读量3.9k

点赞数 8

分类专栏：数据集文章标签： bert 自然语言处理 NLP 数据集

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/cuipanguo/article/details/84584723

版权

数据集专栏收录该内容

1 篇文章 0 订阅

订阅专栏

百度也百度不到，自己看论文归纳了一下，有问题可以指出：

1. MultiNLI（multi-genre natural language inference，文本蕴含识别）

文本间的推理关系，又称为文本蕴含关系。样本都是文本对，第一个文本M作为前提，如果能够从文本M推理出第二个文本N,即可说M蕴含N，M->N。两个文本关系一共有三种entailment（蕴含）、contradiction（矛盾）、neutral（中立）

2. QQP（quora question pairs，文本匹配）

判断两个问题是不是同一个意思，即是不是等价的。属于分类任务

3. QNLI（question natural language inference，自然语言问题推理）

是一个二分类任务。正样本为（question，sentence），包含正确的answer；负样本为（question，sentence），不包含正确的answer。

4. SST-2（the stanford sentiment treebank，斯坦福情感分类树）

分类任务。

5. CoLA（the corpus of linguistic acceptability，语言可接受性语料库）

分类任务，预测一个句子是否是acceptable。

6. STS-B（the semantic textual similarity benchmark，语义文本相似度数据集）

样本为文本对，分数为1-5，用来评判两个文本语义信息的相似度。

7. MRPC（microsoft research paraphrase corpus，微软研究释义语料库）

样本为文本对，判断两个文本对语音信息是否是等价的

8. RTE（recognizing textual entailment，识别文本蕴含关系）

与MNLI相似，只不过数据集更少

9. WNLI（winograd NLI，自然语言推理）

小的数据集

10. SQuAD（the standFord question answering dataset，斯坦福问答数据集）

question，从phrase中选取answer。

11. NER（named entity recognition，命名实体识别）

12. SWAG（the situations with adversarial generations dataset，）

关注

8
点赞
踩
20

收藏

觉得还不错? 一键收藏
3
评论
BERT破的11项纪录具体都是什么？

百度也百度不到，自己看论文归纳了一下，有问题可以指出：1. MultiNLI（multi-genre natural language inference，文本蕴含识别）文本间的推理关系，又称为文本蕴含关系。样本都是文本对，第一个文本M作为前提，如果能够从文本M推理出第二个文本N,即可说M蕴含N，M-&gt;N。两个文本关系一共有三种entailment（蕴含）、contra...
复制链接

扫一扫

专栏目录

评论 3

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。