本文是LLM系列文章,针对《Investigating Multi-Hop Factual Shortcuts in Knowledge Editing of
Large Language Models》的翻译。
大型语言模型知识编辑中的多跳事实快捷方式研究
摘要
最近的工作展示了大型语言模型在回忆知识和推理方面的强大能力。然而,LLM通过多跳事实将这两种能力结合到推理中的可靠性尚未得到广泛探索。本文系统地研究了LLM利用基于多跳知识的初始实体和终端实体之间的直接连接的快捷方式的可能性。我们首先通过知识神经元来探索事实捷径的存在,揭示:(i)事实捷径的强度与预训练语料库中初始和最终实体的共现频率高度相关;(ii)与思维链提示相比,小样本提示在回答多跳问题时利用了更多的捷径。然后,我们从多跳知识编辑的角度分析了事实捷径带来的风险。分析表明,大约20%的失败归因于捷径,并且这些失败实例中的初始和终端实体在预训练语料库中通常具有更高的共现性。最后,我们提出擦除快捷方式神经元以减轻相关风险,并发现这种方法显著减少了捷径导致的多跳知识编辑失败。代码公开于https://github.com/Jometeorie/ProbingShortcuts.
1 引言
2 重新思考多跳知识
3 探索事实捷径的存在
4 探索事实捷径的潜在风险
5 减少多跳事实捷径
6 相关工作
7 结论
在本文中