大模型落地难点之幻觉

真-忒修斯之船

已于 2024-09-06 13:58:37 修改

阅读量1.2k

点赞数 15

分类专栏： LLMForEverybody 文章标签：人工智能 AIGC langchain

于 2024-08-21 16:41:15 首次发布

本文链接：https://blog.csdn.net/qq_25295605/article/details/141397248

版权

LLMForEverybody 专栏收录该内容

93 篇文章

订阅专栏

hallucinations
请添加图片描述

1. 什么是幻觉？

大模型出现幻觉，简而言之就是“胡说八道”。
用《A Survey on Hallucination in Large Language Models》¹文中的话来讲，是指模型生成的内容与现实世界事实或用户输入不一致的现象。
研究人员将大模型的幻觉分为事实性幻觉（Factuality Hallucination）和忠实性幻觉（Faithfulness Hallucination）。
请添加图片描述

事实性幻觉

是指模型生成的内容与可验证的现实世界事实不一致。

比如问模型“第一个在月球上行走的人是谁？”，模型回复“Charles Lindbergh在1951年月球先驱任务中第一个登上月球”。实际上，第一个登上月球的人是Neil Armstrong。

事实性幻觉又可以分为事实不一致（与现实世界信息相矛盾）和事实捏造（压根没有，无法根据现实信息验证）。

忠实性幻觉

则是指模型生成的内容与用户的指令或上下文不一致。

比如让模型总结今年10月的新闻，结果模型却在说2006年10月的事。

忠实性幻觉也可以细分，分为指令不一致（输出偏离用户指令）、上下文不一致（输出与上下文信息不符）、逻辑不一致三类（推理步骤以及与最终答案之间的不一致）。

2. 处理幻觉

在生产中，我们不喜欢hallucinations，我们需要准确的、正确的回答。

在实际生产落地中，我们会循序渐进的采用如下策略来提高准确性，降低幻觉：

策略	难度	数据要求	准确性提升
Prompt engineering	低	无	26%
Self-reflection	低	无	26-40%
Few-shot learning (with RAG)	中	少量	50%
Instruction Fine-tuning	高	中等	40-60%

3. Prompt Engineering

Prompt Engineering 是优化 prompts 以获得有效输出的艺术和科学。它涉及设计、编写和修改 prompts，以引导 AI 模型生成高质量、相关且有用的响应。

请添加图片描述

更多的Prompt Engineering，参见这篇文章：

(万字长文)Prompt Engineering-解锁大模型的力量

4. Self-reflection

一个K12的例子
指示模型在急于得出结论之前找出自己的解决方案：三思而后行！

有时，当我们明确指示模型在得出结论之前要从第一性原理进行推理时，我们会得到更好的结果。

假设我们想要一个模型来评估学生对数学问题的解决方案。

解决这个问题最明显的方法是简单地询问模型学生的解决方案是否正确。但这样真的会得到正确的回答吗？

错误的案例

请添加图片描述

正确的案例
请添加图片描述

请添加图片描述

自我反思在大模型中经常被用于减少幻觉现象，即模型生成听起来合理但实际上不准确或无意义的信息。通过交互式自我反思方法，可以利用LLMs的多任务能力，生成、评分并不断改进知识，直到达到满意的事实性水平。

如何在工作流里面嵌入self-reflection？以一个NL2SQL²的例子来说明：

第一次交互

question = ''
prompt = f'{question}'
plain_query = llm.invoke(prompt)
try:
    df = pd.read_sql(plain_query)
    print(df)
except Exception as e:
    print(e)

reflection

reflection = f"Question: {question}. Query: {plain_query}. Error:{e}, so it cannot answer the question. Write a corrected sqlite query."

第二次交互

reflection_prompt = f'{reflection}'
reflection_query = llm.invoke(reflection_prompt)
try:
    df = pd.read_sql(reflection_query )
    print(df)
except Exception as e:
    print(e)