论文浅尝 | 大型语言模型不是一个好的少样本信息抽取工具，但对于困难样本是一个好的重排工具...

最新推荐文章于 2024-06-05 11:47:36 发布

开放知识图谱

最新推荐文章于 2024-06-05 11:47:36 发布

阅读量848

点赞数

文章标签：语言模型深度学习机器学习人工智能 python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/TgqDT3gGaMdkHasLZv/article/details/129942820

版权

笔记整理：徐欣，浙江大学硕士

链接：https://arxiv.org/pdf/2303.08559.pdf

简介

本文探究了大型语言模型 (LLMs)和微调的小型预训练语言模型(SLMs)在少样本信息抽取(IE)任务上的表现。本文发现LLMs在IE任务上表现不佳，同时存在高延迟和高开销的缺点，但是LLMs擅长处理对SLMs困难的样本。由此，本文提出了适应性的filter-then-rerank范式，SLMs作为过滤器，LLMs作为重排工具。

构建少样本数据集

本文在命名实体识别(NER)、关系抽取(RE)和事件检测(ED)三个任务的8个数据集上进行了实验，原数据集统计如上表所示。本文采用K-shot采样，对于NER和ED，K=1,5,10,20；对于RE，K=1,5,10,20,50,100。如果K-shot数据集包含大于300个句子，按1:9分出验证集和训练集；如果小于300个句子࿰

最低0.47元/天解锁文章

开放知识图谱

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
论文浅尝 | 大型语言模型不是一个好的少样本信息抽取工具，但对于困难样本是一个好的重排工具...

笔记整理：徐欣，浙江大学硕士链接：https://arxiv.org/pdf/2303.08559.pdf简介本文探究了大型语言模型(LLMs)和微调的小型预训练语言模型(SLMs)在少样本信息抽取(IE)任务上的表现。本文发现LLMs在IE任务上表现不佳，同时存在高延迟和高开销的缺点，但是LLMs擅长处理对SLMs困难的样本。由此，本文提出了适应性的filter-then-rerank范式，S...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。