LLMs 中的幻觉问题(LLM 幻觉:现象剖析、影响与应对策略)对其可靠性与实用性构成了严重威胁。幻觉现象表现为模型生成的内容与事实严重不符,在医疗、金融、法律等对准确性要求极高的关键领域,可能引发误导性后果,因此,探寻有效的幻觉缓解技术成为当前人工智能研究的关键任务。
一、RAG:基础但有缺陷的缓解手段
检索增强生成(RAG)作为缓解幻觉的常用方法(RAG(Retrieval-Augmented Generation)评测:评估LLM中的幻觉现象),其核心原理是从外部数据源(如知识库、向量数据库)检索相关信息,并将其作为上下文提供给 LLM 辅助文本生成。在许多知识密集型任务中,它能在一定程度上引入外部事实,约束模型输出,避免完全脱离实际的臆想。例如,在回答关于历史事件的问题时,若模型自身知识储备不足,RAG 可从相关历史资料数据库中提取信息,辅助生成相对准确的回答。
尽管如此,RAG 存在诸多局限性。一方面,其效果高度依赖于检索数据的质量。若向量数据库充斥着过时、错误或不相关的数