大模型LLM | 微软:RAG并不是你唯一的解决方案(显式事实查询、隐式事实查询、可解释推理查询、隐式推理查询)

将外部数据整合到LLMs中的技术,如检索增强生成(RAG)和微调,得到广泛应用,但在不同专业领域有效部署数据增强LLMs面临着重大挑战:

  • 检索相关数据准确解释用户意图充分利用LLMs的推理能力来处理复杂任务
  • 对于数据增强LLM应用来说,没有一种放之四海而皆准的解决方案。
  • 应用落地性能不佳往往是由于未能正确识别任务的核心焦点,或者任务本身就需要多种能力结合,必须被分离出来以获得更好解决方案。

数据增强LLM应用中不同查询层次的主要技术总结

**

微软亚洲研究院(MSRA)提出了一种RAG任务分类方法,根据所需的外部数据类型和任务的主要焦点将用户查询分为四个层次

  1. 显式事实查询(Level-1):直接从数据中检索明确的事实。

  2. 隐式事实查询(Level-2):需要推理或整合数据中的隐含信息。

  3. 可解释推理查询(Level-3):需要理解并应用领域特定的理由和逻辑。

  4. 隐式推理查询(Level-4):需要从数据中推断出隐含的推理逻辑。

四个层次查询的主要焦点

同时,也将外部数据整合到LLMs中的形式归为三种:上下文、小型模型和微调,强调了它们各自的优势、局限性以及它们适合解决的问题类型。

将特定领域数据注入到大型语言模型(LLM)的三种方式:
a) 根据查询提取部分领域数据作为LLM的上下文输入;
b) 用特定领域数据训练一个较小的模型,然后指导后续输入到LLM的外部信息的整合;
c) 直接使用外部领域知识对通用的大型语言模型进行微调,使其成为领域专家模型。

在这里插入图片描述

一、L1:显式事实查询

定义:

  • 显式事实查询(L1)是最简单的数据增强查询类型,可以直接通过访问特定领域的文档或文档片段来回答。
  • 答案通常在文档的纯文本中,需要最小的推理或简单的逻辑。

提供事实信息的常见数据集分层

挑战:

  1. 数据处理困难:外部数据通常是高度非结构化的,包含多种模式(如表格、图像、视频等),处理这些数据时保持原始上下文和意义是一个挑战。

  2. 数据检索困难:从大型非结构化数据集中检索相关数据段计算密集且容易出错。

  3. 评估困难:评估RAG系统的性能,尤其是在组件级别,需要开发能够准确评估数据检索和响应生成质量的稳健指标。

解决方案:

  1. 数据预处理增强:包括文档解析和多模态文档解析,将非文本内容转换为文本形式或使用多模态嵌入技术。

  2. 数据检索增强:使用信息检索(IR)技术,包括建立数据索引、处理查询、检索和匹配、重新排序和评估。

  3. 检索增强生成(RAG):结合了LLMs的生成能力和从大量数据库或文档中检索信息的能力。

三种查询-文档对齐类型

关键点:

  • 显式事实查询依赖于直接从特定数据段中检索答案,不需要复杂的推理。

  • RAG是处理这类查询的常用技术解决方案,它通过动态检索外部信息来增强语言模型的自然语言生成能力。

  • 尽管RAG非常有效,但在构建一个健壮和高质量的系统时仍面临重大挑战。

二、L2:隐式事实查询

定义:

  • 隐式事实查询涉及的数据依赖性并不直接明显,可能需要一些常识推理或基本逻辑推理。

  • 所需信息可能分散在多个文档中,或者需要从数据集中收集和处理多个事实简单的推理,然后通过常识推理将这些事实结合起来得出答案。

挑战:

  1. 自适应检索量:不同的问题可能需要不同数量的检索上下文,固定数量的检索可能造成信息噪声过多或信息不足。

  2. 推理与检索的协调:推理可以指导需要检索的内容,而检索到的信息可以迭代地细化推理策略。

解决方案:

  1. 迭代RAG:类似于多跳RAG任务的方法,动态控制多步骤RAG过程,直到获得正确答案。

  2. 基于规划的:在检索前阶段生成逐步检索计划,或者在检索过程中动态生成,以精细化每次检索的焦点。

  3. 信息差填补:基于现有知识和检索到的信息生成答案,然后继续检索和生成未知部分的答案。

  4. 图/树问题回答:使用图或树来自然地表达文本之间的关系结构,适合这种类型的数据检索问题。

  5. 自然语言到SQL查询:将自然语言查询转换为SQL查询,以便从结构化数据库中检索信息。

关键点:

  • 隐式事实查询要求从多个文档中收集信息,并且可能需要进行多步骤的推理。

  • 这类查询的解决方案通常涉及将复杂问题分解成一系列简单的问题,然后逐一解决。

  • 迭代RAG、图/树问题回答和NL2SQL是处理这类查询的有效方法。

三、L3:可解释推理查询

推理查询的示例

定义:

  • Interpretable Rationale Queries:这类查询需要外部数据来提供解决问题的推理过程。辅助数据通常包括对决策过程的明确解释。

  • 数据形式:可以是纯文本,如指南或手册,也可以是结构化的指令,如工作流程或决策树。

挑战与解决方案

主要挑战:

  • Prompt优化成本:优化提示(Prompt)的过程耗时且计算量大。

  • 有限的可解释性:LLMs对提示的反应不透明,难以一致理解和验证LLMs对不同提示的反应。

解决方案:

  • Prompt Tuning:通过调整提示来提高LLMs遵循外部指令的能力。

  • CoT Prompting:使用链式思考(Chain-of-Thoughts)或思维图(Graph-of-Thoughts)方法来处理复杂的推理问题。

四、L4:隐式推理查询

定义:

  • Hidden Rationale Queries:这类查询需要从外部数据中推断出隐含的推理方法。这些推理方法可能没有明确记录,需要从数据模式和结果中挖掘出来。

  • 数据类型:

  • 领域内数据:可能包括历史问答记录或人工生成的数据。

  • 预备知识:可能包括全面的公理系统或中间结论,如法律代码或数学证明。

挑战与解决方案

主要挑战:

  • 逻辑检索:需要更复杂的检索算法来识别与查询逻辑上相关的文本段。

  • 数据不足:外部数据可能没有明确包含与当前查询相关的指导或答案。

解决方案:

  • 离线学习:通过离线分析数据集来识别和提取规则和指导。

  • 上下文学习:利用示例进行上下文学习,利用LLMs的少量样本学习能力。

离线学习

  • 方法:

  • STaR 和 LXS:使用LLM生成推理理由。

  • GL、LEAP、RICP:通过错误识别和原则概括来改进任务。

上下文学习 (ICL)

  • 方法:

  • OpenICL:探索不同的传统方法对ICL效果的影响。

  • Auto-CoT:通过聚类示例来构建更好的支持学习过程的示例。

微调

  • 方法:

  • 指令调整:使用监督微调来增强LLMs在特定领域的能力。

  • 适配器调整、前缀调整、提示调整:通过优化输入前的可训练向量来提高LLMs的性能。

最后:数据增强LLM应用中查询层次的总结

在这里插入图片描述


如何学习大模型?

学习AI大模型是一个系统的过程,需要从基础开始,逐步深入到更高级的技术。

这里给大家精心整理了一份全面的AI大模型学习资源,包括:AI大模型全套学习路线图(从入门到实战)、精品AI大模型学习书籍手册、视频教程、实战学习、面试题等,资料免费分享!

1. 成长路线图&学习规划

要学习一门新的技术,作为新手一定要先学习成长路线图方向不对,努力白费

这里,我们为新手和想要进一步提升的专业人士准备了一份详细的学习成长路线图和规划。可以说是最科学最系统的学习成长路线。
在这里插入图片描述

2. 大模型经典PDF书籍

书籍和学习文档资料是学习大模型过程中必不可少的,我们精选了一系列深入探讨大模型技术的书籍和学习文档,它们由领域内的顶尖专家撰写,内容全面、深入、详尽,为你学习大模型提供坚实的理论基础(书籍含电子版PDF)

在这里插入图片描述

3. 大模型视频教程

对于很多自学或者没有基础的同学来说,书籍这些纯文字类的学习教材会觉得比较晦涩难以理解,因此,我们提供了丰富的大模型视频教程,以动态、形象的方式展示技术概念,帮助你更快、更轻松地掌握核心知识

在这里插入图片描述

4. 大模型项目实战

学以致用 ,当你的理论知识积累到一定程度,就需要通过项目实战,在实际操作中检验和巩固你所学到的知识,同时为你找工作和职业发展打下坚实的基础。

在这里插入图片描述

5. 大模型面试题

面试不仅是技术的较量,更需要充分的准备。

在你已经掌握了大模型技术之后,就需要开始准备面试,我们将提供精心整理的大模型面试题库,涵盖当前面试中可能遇到的各种技术问题,让你在面试中游刃有余。

在这里插入图片描述

全套的AI大模型学习资源已经整理打包,有需要的小伙伴可以微信扫描下方CSDN官方认证二维码,免费领取【保证100%免费

如有侵权,请联系删除

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值