AI领域的新突破：混合RAG系统提升复杂推理能力

最新推荐文章于 2025-02-18 16:20:35 发布

程序员笑武

最新推荐文章于 2025-02-18 16:20:35 发布

阅读量1k

点赞数 22

文章标签：人工智能 langchain 测试用例前端知识图谱

本文链接：https://blog.csdn.net/m0_59164304/article/details/142794821

版权

核心概述

这本主要介绍了一种增强的混合检索增强生成（RAG）系统，通过改进网页中的文本块和表格、添加属性预测器以减少幻觉现象、进行LLM知识提取器和知识图谱提取器工作，并构建了一个包含所有引用的推理策略，这一系列优化，显著提高了检索质量、增强了推理能力，并细化了数值计算能力。

01.研究背景

背景介绍: 这篇文章的研究背景是检索增强生成（RAG）框架，该框架通过整合外部知识库来增强大型语言模型（LLMs）的准确性和减少幻觉现象。
研究内容: 包括改进网页文本块和表格的处理，添加属性预测器以减少幻觉，进行LLM知识提取器和知识图提取器，并最终构建一个包含所有引用的推理策略。
相关工作: 形式验证、高效的训练方法等，但这些方法大多针对特定问题场景，不适合直接应用于CRAG任务。本文在前人研究的基础上，提出了一个集成多种策略的新颖设计。

02.研究过程及方法剖析

系统中有6个关键模块，包括（1）网页处理，（2）属性预测器，（3）数值计算器，（4）大语言模型知识提取器，（5）知识图谱模块， (6)推理模块。我们通过这些模块增强了系统在信息提取、减少幻觉、数值计算精度、高阶推理等方面的能力。此外，我们还对极端情况进行了特殊处理。

网页处理：使用Trafilatura和BeautifulSoup提取网页上的文本块和表格，并使用Blingfire将文本分句。文本块根据启发式规则进行分组，表格转换为Markdown格式。
属性预测器：开发了属性预测器，评估每个问题的类型和事实变化率，以优化所有问题类型的性能。使用了上下文学习和支持向量机（SVM）两种方法进行分类。
数值计算器：通过提示技术鼓励大型语言模型生成有效的Python表达式，并将实际数值计算任务委托给外部Python解释器。
LLM知识提取器：开发了LLM知识提取器，利用大型语言模型的知识丰富的响应作为参考材料，增强推理能力。
知识图谱模块：使用手动规则从查询中提取实体，并生成查询。由于时间和资源限制，最终版本回归到基线方法。
推理模块：设计了提示模板，让LLM从所有参考材料中进行推理，得到最终答案。控制了推理路径和输出格式，并处理了许多角落案例。

【处理极端情况】

除了上面提到的主要模块之外，我们还处理了很多极端情况，包括**（1）识别无效问题；（2）鼓励模型对不确定的答案回答“我不知道”，以减少幻觉；(3)对不符合指令格式的输出进行处理。** 接下来，我将介绍我们处理这些极端情况的设计。

无效问题。有些问题的前提是错误的，这意味着查询与事实相矛盾。对于这些问题，模型应该输出“无效问题”。为了识别此类问题，模型需要仔细分析所提供的参考文献。我们在附录C.5所示的推理提示中添加特殊规则
减少幻觉。我们采用两种方法来减轻幻觉：属性预测和推理。我们发现，时变问题（被属性预测器标记为动态)对于我们的系统来说很难，我们没有足够的时间和资源来改进它们。所以我们手动让系统对这些问题回答“我不知道”。此外，我们在推理模块中添加了一些规则和提示工程技术，让模型在不确定时回答“我不知道”。最终，我们将系统配置为专门输出“我不知道”，并且在初始响应中包含“我不知道”时避免添加任何其他单词。
格式不正确。由于我们没有对推理输出进行约束采样，因此模型有可能输出无法解析的答案。为了处理这种情况，我们设计了一个备份摘要代理，在解析失败时根据推理模块的输出准确、简洁地总结最终答案。

如何学习大模型 AI ？

由于新岗位的生产效率，要优于被取代岗位的生产效率，所以实际上整个社会的生产效率是提升的。

但是具体到个人，只能说是：

“最先掌握AI的人，将会比较晚掌握AI的人有竞争优势”。

这句话，放在计算机、互联网、移动互联网的开局时期，都是一样的道理。

我在一线互联网企业工作十余年里，指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑，所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

在这里插入图片描述