本文是LLM系列文章,针对《KG-CTG: Citation Generation through Knowledge Graph-guided Large Language Models》的翻译。
摘要
引文文本生成(CTG)是自然语言处理(NLP)中的一项任务,旨在生成准确引用或引用源文档中引用文档的文本。在CTG中,生成的文本利用了源文档和引用论文的上下文线索,确保提供准确和相关的引用信息。引文生成领域的先前工作主要基于文献的文本摘要。在此基础上,本文提出了一个框架和一项比较研究,以证明大型语言模型(LLMs)在引文生成任务中的使用。此外,我们通过将论文的知识图谱关系纳入提示中,使LLM更好地了解论文之间的关系,从而提高了引文生成的结果。为了评估我们的模型的性能,我们使用了标准S2ORC数据集的一个子集,该数据集仅由英语语言的计算机科学学术研究论文组成。Vicuna在这项任务中表现最佳,有14.15Meteor、12.88Rouge-1、1.52Rouge-2和10.94Rouge-L。此外,羊驼表现最好,通过包含知识图谱,在Rouge-1和Meteor中的表现分别提高了36.98%和33.14%。