【论文浅尝】CODEIE: Large Code Generation Models are Better Few-ShotInformation Extractors

是饿梦啊

于 2024-05-03 20:43:45 发布

阅读量1.3k

点赞数 33

文章标签：人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_47982709/article/details/138398627

版权

文章探讨了如何通过将结构化输出转化为代码形式，利用代码LLM如Codex执行信息提取任务。实验表明，代码提示的CodeLLM在NER和RE任务中优于传统模型，尤其是在few-shot学习情况下。编码结构的目标使得输出更精确，展示了代码表示在IE任务中的优势。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

INTRODUCTION

在本文提出将结构化输出转换为代码而不是自然语言的形式，并利用代码的生成法学硕士(code -LLMs)，如Codex来执行IE任。与nl - llm相比，我们展示了代码- llm可以通过设计代码样式提示并将这些IE任务制定为代码生成任务来与这些IE任务很好地对齐。

以下图中的示例输入“Steve在1998年成为Apple的CEO”为例，我们将其包装成一段Python代码，并将结构化实体输出制定为带有键“text”和“type”的Python字典。我们将它们组合成一个Python函数，该函数在语义上等同于NER示例：

文中在NER和RE任务的七个基准上进行了实验，并仔细分析了我们的方法(称为CODEIE)的好处。研究结果如下:

1)具有代码样式输入的提示code- llm(Codex) 始终优于微调UIE，这是一种针对IE任务的特别预训练模型，并且在少量设置下提示nl - llm(GPT-3)。

2)对于相同的LLM(无论是NL-LLM还是CodeLLM)，代码风格的提示符比线性化的文本提示符表现得更好，展示了用代码表示结构化目标的优势。

3)在相同的提示符(自然语言或代码)下，Code - LLM(即Codex)比NL-LLM(即GPT-3)实现了更好的性能，证明了使用code - llm执行IE任务的优点。

4)与自然语言提示相比，使用代码样式的提示对输出结构的保真度更高，即输出的结构错误率更低

下图总结了IE任务中等规模模型、nl - llm和code - llm之间的层次差异。

CODEIE

Task Formulation

给定一个输入句子x，其中有l个标记 $x_{1}$ , $x_{2}$ , . . . , $x_{l}$ , IE任务是从x预测结构化目标y。

NER的目标y是一组(e, t)对，其中e是一个实体跨度(如“Steve”)，t是对应的实体类型(如“person”)。实体跨度是来自x的令牌序列，实体类型属于预定义的实体类型集T。

RE的

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

是饿梦啊 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。