本文是LLM系列文章,针对《Instruct and Extract: Instruction Tuning for On-Demand Information Extraction》的翻译。
摘要
具有指令跟随功能的大型语言模型为更广泛的用户群体打开了大门。然而,当涉及到信息提取(自然语言处理中的经典任务)时,大多数特定于任务的系统无法很好地与非专家用户的长尾特别提取用例保持一致。为了解决这一问题,我们提出了一种新的范式,称为按需信息提取,以满足现实世界用户的个性化需求。我们的任务旨在按照说明从相关文本中提取所需内容,并以结构化表格格式呈现。表标题可以是用户指定的,也可以是模型根据上下文推断的。为了促进这一新兴领域的研究,我们提出了一个名为InstructionIE的基准,包括自动生成的训练数据和人工注释的测试集。在Instructionie的基础上,我们进一步开发了一个按需信息提取器ODIE。对我们基准的全面评估表明,ODIE大大优于现有的类似规模的开源模型。我们的代码和数据集发布于https://github.com/yzjiao/On-Demand-IE.
1 引言
2 相关工作
3 INSTRUCTIE数据集
4 实验
5 结论
本文介绍了一项新任务,即按需信息提取,通过根据指令提取内容,并将其组织在具有用户指定或模型推断标题的表中,来满足用户的个性化需求。为了对这项新任务进行基准测试ÿ