大模型中的幻觉问题：根源、影响与解决方案

最新推荐文章于 2025-04-20 18:55:31 发布

隐私无忧

最新推荐文章于 2025-04-20 18:55:31 发布

阅读量3.3k

点赞数 75

分类专栏： # AIGC实验场文章标签：人工智能 AIGC

本文链接：https://blog.csdn.net/apr15/article/details/135326897

版权

23 篇文章

订阅专栏

本文探讨了人工智能领域的幻觉问题，定义了Faithfulness和Factualness，分析了模型复杂性、训练数据等因素导致幻觉的原因，并提出了改进训练方法和引入外部知识等解决策略。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

在人工智能和自然语言处理领域，大规模语言模型（LLM）已成为研究和应用的热点。这些模型在理解和生成自然语言方面表现出了强大的能力，但在其不断发展的过程中，一个突出的问题——幻觉（hallucination）现象，也开始引起人们的关注。

幻觉是LLM在处理输入时产生的一种错误现象，即模型生成的输出与输入的原始语义无关或不一致。

定义：当模型生成的文本不遵循原文（Faithfulness）或者不符合事实（Factualness），就认为模型出现了幻觉的问题。

the generated content that is nonsensical or unfaithful to the provided source content

什么是Faithfulness and Factualness：

通俗的说，幻觉指的是一本正经的胡说八道：看似流畅自然的表述，实则不符合事实或者是错误的。

幻觉可以分为以下三种类型：

模型复杂性：LLM由于其巨大的参数规模和深度架构，容易受到训练数据中的噪声和异常值的影响。在训练过程中，模型可能会过度拟合这些噪声，导致在生成时表现出幻觉。
训练数据的重复性：训练过程中使用的数据，如果存在大量重复，可能导致模型在生成时过于偏好某些高频短语，这也可能引发“幻觉”。
数据噪声的影响：使用充斥噪声的数据进行训练，往往是导致“幻觉”出现的关键因素之一。
解码过程中的随机性：某些旨在增加输出多样性的解码策略，如top-k采样、top-p方法以及温度调节，有时会增加“幻觉”的产生。这往往是因为模型在选择输出词汇时引入了随机性，而没有始终选择最可能的词汇。
模型的参数知识偏向：有研究表明，模型在处理信息时，可能更依赖其在预训练阶段所积累的知识，而忽略了实时提供的上下文信息，从而偏离了正确的输出路径。
自回归性质：LLM通常采用自回归的方式进行训练，这意味着模型会根据已经生成的词来预测下一个词。由于这种预测方式可能导致模型过于自信地生成与原始输入无关的词，从而产生幻觉。
缺乏外部知识：LLM在训练过程中主要依赖于大规模语料库，缺乏对现实世界知识的理解。因此，模型可能会生成与现实世界常识不一致的幻觉。

改进训练方法：通过使用更先进的优化算法和正则化技术，可以减少模型对噪声和异常值的敏感性。例如，可以采用预训练-微调（pretraining-and-fine-tuning）的方法，先用大规模无监督数据训练模型，再使用有监督数据进行微调，以减少模型对噪声的过度拟合。
引入外部知识源：通过将外部知识源（如知识图谱、常识库等）整合到LLM中，可以增强模型的推理能力。例如，可以利用知识蒸馏（knowledge distillation）技术，将大规模知识蒸馏到一个更小、更高效的模型中。
自监督学习：通过让模型预测上下文中的词来学习语言的内在结构和模式，可以减少幻觉的产生。例如，可以使用对比学习（contrastive learning）的方法，让模型学习到输入和输出之间的相似性和差异性。