大模型还能产生幻觉？一文讲清楚原理和解决方法幻觉

AIGC莹子

于 2024-09-27 22:05:30 发布

阅读量570

点赞数 7

文章标签：人工智能 flutter 产品经理大数据知识图谱

本文链接：https://blog.csdn.net/z551646/article/details/142603290

版权

“像我们这样相信物理学的人都知道，过去、现在和未来之间的区别只是一种顽固执着的幻觉。换句话说，时间是一种幻觉。”

                                                                                                                           ——波尔

幻觉，即一种看似真，实为假的感受。最近接触到了一个概念：大模型幻觉。有点好奇，大模型还能产生幻觉？于是查找了一些资料，开始了解。

关于大模型幻觉，官方一点的说法是这样的：

大模型的幻觉问题，即Hallucination，指模型基于有限元素和强大的语言表达能力生成逻辑上似乎合理但实际不符合已知常识的描述。幻觉可能由错误数据、训练过程失误、推理错误等多种原因触发。

直白来说，大模型幻觉就是一本正经地胡说八道。它就好像饭桌上，那个爱吹牛的熟人，推杯换盏间，嘴里几句真话、几句假话，不得而知。

2023年，一名联邦法官对纽约市的一家律师事务所处以 5000 美元罚款。原因是该所的一名律师，使用ChatGPT 起草了一起人身伤害案件的摘要，而里面捏造了六个以上的案例。

斯坦福大学和耶鲁大学的研究人员在关于三种流行的大语言模型（LLM）的研究预印本中发现，类似的错误在人工智能生成的法律输出里极为普遍。

**无论是哪种大模型，都会出现不同程度的“幻觉”。**其症状的轻重，与科技公司的实力相关。

一般来说，大模型幻觉分为两大类：事实性幻觉和忠实性幻觉。

事实性幻觉强调生成的内容与可验证的现实世界事实之间的差异。其通常表现为事实不一致或捏造。比如说回答历史事件的具体时间或人物关系时出现错误。

忠实幻觉是指生成内容与用户构思或输入所提供上下文的差异，以及生成内容内部的自我一致性。例如要求总结某一篇文章的主要内容，但模型生成的总结包含了原文中没有提到的观点或信息。

OpenAI华人科学家翁荔，在她最新的Blog中提到：产生幻觉的原因包括预训练数据问题和微调新知识问题。

不会。在《hallucination is inevitable: an innate limitation of large language models

》实验论文中，给出了一个基本结果：即无论模型架构、学习算法、提示技术或训练数据如何改变，对于任何可计算的LLM来说，幻觉是不可避免的。

亚利桑那州立大学研究人工智能的教授 Subbarao Kambhampati，对此也说道：“所有计算机生成的创造力在某种程度上都是幻觉。”

此外许多机器学习专家也不认为幻觉是可以修复的。比如微软研究院和佐治亚理工学院发表的《Calibrated Language Models Must Hallucinate》研究表示：经过校准的语言模型必然会出现幻觉。

所以从技术层面来说，由于现实世界问题的多样复杂性，无论如何训练大模型，总会存在超出模型能力的可解决问题。

“幻觉”虽不会停止，但我们可以尽可能地减轻幻觉。

对于我们普通使用者来说，减轻幻觉的一个直接方法是：调教你的AI，并对其保持批判的态度。

从技术层****面来说，减少LLM幻觉的技术方法包括：

高等提示词：通过编写更具体的提示词，如多事例学习，以及使用新的工具来优化提示词，管束LLM的幻觉问题。
Meta AI的Chain - of - Verification（CoVe）：将事实核对分解为可管理的步骤，通过生成初始响应、组织验证问题、独立回答这些问题并生成最终经过验证的响应，来减少LLM的幻觉情况，提高响应正确性。
知识图谱：将知识图谱集成到RAG中，利用其结构化且相互关联的数据，增强当前RAG系统的推理能力。
Raptor：通过建立更高层次的抽象来处理跨多个文档的问题，先从外部知识库中检索相关且经过验证的信息，然后将这些数据与原始查询一同嵌入到模型中，减少幻觉现象。
共形抽离：通过应用共形猜想技术来确定模型何时应该停止给出响应，从而减少大型语言模型（LLMs）中的幻觉情况。
RAG削减结构化输入中的幻觉情况：ServiceNow通过RAG在生成文本之前从外部知识库中检索相关的JSON对象，确保生成过程基于正确且相关的数据，减少幻觉情况。