PaDeLLM-NER: Parallel Decoding in Large Language Models for Named Entity Recognition

最新推荐文章于 2024-10-07 06:31:57 发布

UnknownBody

最新推荐文章于 2024-10-07 06:31:57 发布

阅读量46

点赞数

文章标签：语言模型人工智能自然语言处理

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/c_cpp_csharp/article/details/136863470

版权

LLM 日更专栏收录该内容

828 篇文章 3 订阅

已下架不支持订阅

本文提出了一种名为PaDeLLM-NER的方法，用于减少大型语言模型（LLM）在命名实体识别（NER）任务中的延迟。通过并行解码，PaDeLLM-NER能够在不牺牲预测质量的前提下，显著提高推理速度，对于英语和汉语的实验显示，其速度提升可达1.76到10.22倍。

摘要由CSDN通过智能技术生成

本文是LLM系列文章，针对《PaDeLLM-NER: Parallel Decoding in Large Language Models for Named Entity Recognition》的翻译。

PaDeLLM-NER：用于命名实体识别的大型语言模型中的并行解码

摘要
1 引言
2 相关工作
3 方法
4 实验
5 加速分析
6 数据污染问题
7 结论

摘要

在这项研究中，我们旨在减少使用大型语言模型（LLM）进行命名实体识别（NER）的生成延迟。LLM中高延迟的主要原因是顺序解码过程，该过程自回归地生成NER的所有标签和提及，显著增加了序列长度。为此，我们在用于NER的LLM中引入了并行解码（PaDeLLM-NER），这是一种无缝集成到现有生成模型框架中的方法，无需额外的模块或架构修改。PaDeLLM-NER允许同时解码所有提及，从而减少生成延迟。实验表明，对于英语和汉语，PaDeLLM-NER显著提高了推理速度，比自回归方法快1.76到10.22倍。同时，它保持了预测的质量，在各种数据集中的性能与最先进的技术不相上下。

1 引言

2 相关工作

3 方法

4 实验

5 加速分析

6 数据污染问题

了解本专栏

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

已下架不支持订阅

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

UnknownBody 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。