NLP-问答-榜单

最新推荐文章于 2023-02-15 12:24:44 发布

ziuno

最新推荐文章于 2023-02-15 12:24:44 发布

阅读量307

点赞数

分类专栏： NLP 文章标签：自然语言处理

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ziuno/article/details/116054067

版权

NLP 专栏收录该内容

14 篇文章 0 订阅

订阅专栏

有维护

A/B：榜单

榜单	榜	top1 模型	em(exact match)	f1	acc	mrr	score
GrailQA	Overall	ReTraCk	58.136	65.285
-	Compositional Generalization	ReTraCk	61.499	70.911
-	Zero-shot Generalization	ArcaneQ	49.964	58.844
PubMedQA	-	Baseline Model		52.72	68.08
AmbigQA	Standard setting	Refuel		44.3(all) 34.8(multi) 15.9(bleu) 10.1
-	Zero-shot setting	SpanSeqGen	42.2	30.8(all) 20.7(multi)
DREAM	-	ALBERT-xxlarge + DUMA + Multi-Task Learning			91.8
MathQA	-	Seq2Prog+Cat			37.4
LC-QuAD 2.0
ComQA	-		22.4
QASC	-	UnifiedQA			0.8957
Quoref	-	CorefRoBERTa	0.8061	0.8670
Physical IQA	-	UNICORN			0.9013
Social IQA	-	UNICORN			0.8315
CoQA	-	RoBERTa + AT + KD			91.4(in-domain) 89.2(out-of-domain) 90.7(overall)
DROP	-	QDGAT - ALBERT	0.8704	0.9010
ARC	-	UnifiedQA + ARC MC/DA + IR			0.8140
CommonsenseQA
ComplexWebQuestions
HotpotQA	Distractor Setting	S2G+	70.72{ans) 64.30(sup) 48.60(joint)	83.53(ans) 88.72(sup) 75.45(joint)
-	Fullwiki Setting	TPRR	66.95(ans) 59.43(sup) 44.37(joint)	79.50(ans) 84.25(sup) 70.83(joint)
OpenBookQA	-	UnifiedQA			0.872
ProPara Dataset	-	KOALA		0.704	0.777
QuAC	-	RoR		74.9
RACE	-	ALBERT-SingleChoice + transfer learning			91.4
ReCoRD	-	LUKE	90.64	91.21
QAngaroo	WikiHop	RealFormer-large			84.4
-	MedHop	MedKGQA			64.8
ShARC	End-to-end Task	DGM			0.774(micro) 0.812(macro)
SWAG	-	DeBERTa			0.9171
SQuAD	2.0	FPNet	90.871	93.183
-	1.1	LUKE	90.202	95.379
TriviaQA
Who-did-What	-	GA with word features	0.712(who-did-what) 0.77(cnn)

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
NLP-问答-榜单

有维护榜单榜top1 模型em(exact match)f1accmrrscoreGrailQAOverallReTraCk58.13665.285-Compositional GeneralizationReTraCk61.49970.911-Zero-shot GeneralizationArcaneQ49.96458.844PubMedQA-Baseline Model52.7268.08
复制链接

扫一扫

专栏目录

ziuno CSDN认证博客专家 CSDN认证企业博客

码龄7年

37: 原创

11万+: 周排名

112万+: 总排名

2万+: 访问

: 等级

500: 积分

10: 粉丝

23: 获赞

7: 评论

56: 收藏

私信

关注

热门文章

分类专栏

NLP面试学习
ESP32
torch 3篇
强化学习 2篇
论文 1篇
AllenNLP 2篇
NLP 14篇
笔记 34篇
BERT
NLPCamp 2篇
模型 3篇
吴恩达机器学习 8篇
机器学习 12篇
Tensorflow 1篇
可视化 1篇

最新评论

PyLucene安装
B ! UE: 答主说的有误，或许版本不同，lucene是可以安装在不同的环境下的，只需要在makefile里指定python的路径就可以
reinforcement_q_learning—解读
m0_69382521: 感谢博主分享，很棒的文章，小菜鸟求带，可以加你微信随时和您交流吗
NLP-2021-调研
不正经的kimol君: 大佬，我准备跟你混了！
《机器学习》阅读笔记（二）
梦逸清尘: 为什么测试错误率实际上并不独立，会导致过高估计假设成立的概率呢？
BERT-中文-Classifier-实战
B c c· 回复 ziuno: 谢谢您

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。