LLM幻觉的终结者：华人团队揭示对数线性定律与CoDA策略

最新推荐文章于 2025-04-08 09:34:10 发布

东方佑

最新推荐文章于 2025-04-08 09:34:10 发布

阅读量699

点赞数 25

分类专栏：量子变法文章标签：人工智能机器学习自然语言处理

本文链接：https://blog.csdn.net/weixin_32759777/article/details/147048687

版权

455 篇文章

订阅专栏

大语言模型（LLMs）的崛起彻底改变了人工智能领域，但“幻觉”问题始终如影随形。即使基于高质量训练数据，LLMs仍会编造事实，例如“一本正经地胡说八道”。这种现象被称为“LLM幻觉”，是阻碍AI可信度的核心难题。

如今，来自UIUC、哥伦比亚大学等顶尖机构的华人团队，从LLM的根本机制出发，首次揭示了幻觉的底层规律，并提出创新解决方案。他们的研究不仅为理解幻觉提供了理论框架，更通过对数线性定律和CoDA策略，为构建更可控、更可信的AI开辟了新路径。

研究团队发现，LLM的幻觉并非单纯源于训练数据的缺陷，而是模型内部知识竞争的结果——知识遮蔽（Knowledge Overshadowing）。

什么是知识遮蔽？
当模型中高频知识（如广泛传播的事实）与低频知识（如小众或新兴信息）同时存在时，高频知识会掩盖低频知识，导致模型生成错误输出。例如：

通过合成数据集实验，团队发现幻觉率与三个关键因素呈对数线性关系：

公式：
[
\text{幻觉率} = \alpha \cdot \ln§ + \beta \cdot \ln(L) + \gamma \cdot \ln(S) + \delta
]

为减少幻觉，团队提出CoDA（Contrastive Decoding with Attenuation）策略，通过以下步骤放大被遮蔽知识：

检测被遮蔽的token
- 通过逐步屏蔽输入中的关键token（如“非洲”），观察模型输出的变化。
- 若输出偏向高频知识（如忽略“非洲”），则判定该token被遮蔽。
量化遮蔽效应
- 使用R-PMI（相对点互信息）和ERM（逃避奖励机制），评估被遮蔽知识对输出的影响。
增强被遮蔽知识
- 对比原始输入与屏蔽后的输出，通过对比解码修正偏差，优先保留低频知识。