EntGPT: Linking Generative Large Language Models with Knowledge Bases

最新推荐文章于 2025-12-18 14:23:27 发布

UnknownBody

最新推荐文章于 2025-12-18 14:23:27 发布

阅读量158

点赞数

CC 4.0 BY-SA版权

分类专栏： Knowledge Graph 文章标签：语言模型人工智能自然语言处理

本文链接：https://blog.csdn.net/c_cpp_csharp/article/details/136866092

Knowledge Graph 同时被 2 个专栏收录

86 篇文章 ¥99.90 ¥299.90

订阅专栏

LLM 日更

828 篇文章

已下架不支持订阅

本文介绍了EntGPT，一种旨在通过实体消歧任务提升大型语言模型（LLM）事实正确性能力的方法。通过三步硬提示方法和指令调整，EntGPT在无监督微调的情况下提高了Micro-F1分数，与监督基线相比，在实体消歧和问答任务中表现更优。研究表明，增强实体知识对于改善LLM的幻觉问题和提高问答性能有益。

本文是LLM系列文章，针对《EntGPT: Linking Generative Large Language Models with Knowledge Bases》的翻译。

摘要

由于在训练和推理过程中缺乏事实核查和知识基础，大型语言模型（LLM）生成事实正确输出的能力仍然相对未被探索。在这项工作中，我们的目标是通过实体消歧（ED）任务来应对这一挑战。我们首先考虑提示工程，并设计了一种三步硬提示方法来探测LLM的ED性能，而无需监督微调（SFT）。总体而言，提示方法提高了Micro-𝐹1分，在某些情况下高达36%甚至更高，并且与现有的SFT方法相比，在10个数据集上获得了可比的性能。我们通过具有类似提示和响应的指令调整（IT）进一步提高了知识基础能力。与具有平均micro的监督实体消歧任务的几种基线方法相比，指令调整模型不仅实现了更高的micro-F1分数性能-𝐹1比现有的基线模型提高了2.1%，但在零样本设置下，在六个问答（QA）任务上也获得了更高的准确性。我们的方法同时适用于开源和闭源LLM。