NLP基准测试总结

最新推荐文章于 2024-07-19 00:12:30 发布

junjie20082008

最新推荐文章于 2024-07-19 00:12:30 发布

阅读量917

点赞数

分类专栏： NLP 深度学习算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/junjie20082008/article/details/105015001

版权

本文总结了自然语言处理领域的两大基准测试——GLUE和SQuAD。GLUE包含了9项NLU任务，如CoLA、SST、QQP等，用于评估模型的综合理解能力。SQuAD是一个阅读理解数据集，要求算法从文章中找出问题的答案。这些基准测试对于推动NLP技术的发展起着重要作用。

摘要由CSDN通过智能技术生成

先把GLUE榜单地址挂上：https://gluebenchmark.com/leaderboard/

1、SQuAD（Stanford Question Answering Dataset）

SQuAD是什么？

SQuAD 是斯坦福大学于2016年推出的数据集，一个阅读理解数据集，给定一篇文章，准备相应问题，需要算法给出问题的答案。此数据集所有文章选自维基百科，数据集的量为当今其他数据集(例如，WikiQA)的几十倍之多。一共有107,785问题，以及配套的 536 篇文章。数据集的贡献者为斯坦福Percy Liang等人，Percy Liang是自然语言处理界的一位全才，在Semantic Parsing, QA, Optimization等多

2、GLUE

通常来说，NLP可以分为自然语言理解（NLU）和自然语言生成（NLG）。在NLU方面，我们拿时下最流行的GLUE(General Language Understanding Evaluation)排行榜举例，其上集合了九项NLU的任务，分别是：

CoLA(The Corpus of Linguistic Acceptability):纽约大学发布的有关语法的数据集，该任务

最低0.47元/天解锁文章

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

博客等级

码龄15年

20
原创

20
点赞

56
收藏

20
粉丝

关注

私信

热门文章

分类专栏

NLP 8篇
spark 1篇
HIVE 2篇
算法 20篇
深度学习 13篇
caffe 1篇
python 14篇
数据挖掘 2篇
tenforflow 9篇
BIRNN 1篇
LSTM 1篇

最新评论

bert连续输出loss
恋志传奇: 有没有办法直接拿到loss的值哇
bert 分布式优化
hrdxwandg1987: 问下每个gpu 是均为batchsize，还是 batchsize/nums_gpu?
bert推理速度太慢的解决方案[用于生成表征向量]
samoyan: 感谢楼主，一直想了解一下基于tf如何获取bert 的各个层的输出，想问下楼主是否有github的链接分享？
bert连续输出loss
Forizon 回复 ☆SaKura_: 没错这个是对的
bert连续输出loss
☆SaKura_: 这样的才对： train_op = optimization.create_optimizer( total_loss, learning_rate, num_train_steps, num_warmup_steps, use_tpu) logging_hook = tf.train.LoggingTensorHook({"total_loss:": total_loss}, every_n_iter=10) output_spec = tf.contrib.tpu.TPUEstimatorSpec( mode=mode, loss=total_loss, train_op=train_op, training_hooks=[logging_hook], scaffold_fn=scaffold_fn)

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。