技术公司积累了大量的专有文档,工程师尤其是新员工需要快速查询这些文档或吸收其中的新知识。然而,导航大量文档并理解其中的领域特定术语和缩略语是一个巨大的挑战。传统的LLM微调方法计算成本高,对新知识的泛化能力差,且可能覆盖旧知识。RAG框架虽然灵活且可扩展,但在处理领域特定文档时,仍面临术语误解和上下文缺失的问题。文章要解决的问题是如何在工业知识库中高效地导航,克服传统LLM微调和RAG框架在领域特定术语和上下文解释方面的挑战。
现有的RAG技术在处理工业知识库中的领域特定查询时表现不佳。例如,传统的RAG方法在解释领域特定术语时容易出现幻觉现象,导致生成错误或无意义的信息。现有方法如Corrective RAG和Self-RAG试图在检索后修改响应,但这些方法无法解决由于术语歧义或缺乏上下文导致的问题。
因此,本文的方法主要是前处理部分,识别专有术语,增强上下文回答。
现有RAG
一、方法
-
LLM驱动的文档增强:首先,使用OCR从公司原始文档中提取文本,并将其分割成较小的可管理片段进行处理。然后,利用LLM从领域专家的角度生成摘要,增强文档数据库。
LLM驱动的文档增强
关于文档解析可以看看《【文档智能 & RAG】RAG增强之路:增强PDF解析并结构化技术路线方案及思路》
文档智能结构化
-
识别术语:使用LLM识别用户问题中的术语和缩写。设计一个提示模板,指导大型语言模型(LLM)从输入问题中提取并列出所有术语和缩略语。这个过程确保所有潜在的模糊术语都被识别出来,以便后续处理。在工作流程中,术语识别步骤表示为一个双向分支节点。如果识别出的术语列表为空,主程序**沿“No”路径继续;否则,沿“Yes”路径继续。识别的术语列表被保存并用于后续的上下文识别和术语查询步骤。
-
识别上下文:设计一个提示模板,该模板包含一系列预定义的上下文名称及其描述。提示模板的作用是引导LLM识别问题的上下文。将问题作为输入,使用提示模板引导LLM识别问题的上下文。通过使用CoT**提示的少量示例来增强LLM的性能,指导LLM以指定的数据结构进行响应。
-
查询术语词典:将步骤2中识别的术语列表插入到一个SQL查询模板中。这个查询模板用于从术语词典的SQL数据库**中检索相关信息。处理SQL查询模板,从术语词典中检索相关的详细信息,包括扩展名称、详细描述和关于术语的任何相关注释。避免使用LLM生成SQL查询:选择不使用LLM直接生成SQL查询,因为这可能引入查询质量和安全性的不确定性,并增加推理成本。相反,采用基于代码的方法合成SQL查询,确保查询的安全性和可靠性。
-
增强问题:将识别的上下文和术语定义整合到原始问题中,生成增强的问题。确保RAG框架能够检索到最相关的文档。
-
查询未响应:在某些情况下,系统可能无法在词典中找到某些术语的相关信息。
Golden-Retriever有一个回退机制,合成一个响应,指示数据库无法回答该问题。
-
- 术语不存在于词典中:有些术语可能在当前的术语词典中没有记录,导致查询返回空结果。
- 拼写错误:用户输入的术语可能存在拼写错误,导致无法正确匹配词典中的条目。
- 词典更新滞后:术语词典可能没有及时更新,导致最新的术语和缩略语未能收录。
二、实验
与vanilla LLM和RAG相比,Golden-Retriever显著提高了Meta-Llama-3-70B的总得分,分别提高了79.2%和40.7%。在所有测试的LLMs中,Golden-Retriever平均比Vanilla LLM提高57.3%,比RAG提高35.0%。
总结
论文提出Golden-Retriever,一种新颖的Agentic RAG系统,高效地导航庞大的工业知识库,并克服领域特定术语和上下文解释的挑战。
如何系统的去学习大模型LLM ?
大模型时代,火爆出圈的LLM大模型让程序员们开始重新评估自己的本领。 “AI会取代那些行业
?”“谁的饭碗又将不保了?
”等问题热议不断。
事实上,抢你饭碗的不是AI,而是会利用AI的人。
继科大讯飞、阿里、华为
等巨头公司发布AI产品后,很多中小企业也陆续进场!超高年薪,挖掘AI大模型人才! 如今大厂老板们,也更倾向于会AI的人,普通程序员,还有应对的机会吗?
与其焦虑……
不如成为「掌握AI工具的技术人
」,毕竟AI时代,谁先尝试,谁就能占得先机!
但是LLM相关的内容很多,现在网上的老课程老教材关于LLM又太少。所以现在小白入门就只能靠自学,学习成本和门槛很高。
针对所有自学遇到困难的同学们,我帮大家系统梳理大模型学习脉络,将这份 LLM大模型资料
分享出来:包括LLM大模型书籍、640套大模型行业报告、LLM大模型学习视频、LLM大模型学习路线、开源大模型学习教程
等, 😝有需要的小伙伴,可以 扫描下方二维码领取🆓↓↓↓
一、LLM大模型经典书籍
AI大模型已经成为了当今科技领域的一大热点,那以下这些大模型书籍就是非常不错的学习资源。
二、640套LLM大模型报告合集
这套包含640份报告的合集,涵盖了大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。(几乎涵盖所有行业)
三、LLM大模型系列视频教程
四、LLM大模型开源教程(LLaLA/Meta/chatglm/chatgpt)
LLM大模型学习路线 ↓
阶段1:AI大模型时代的基础理解
-
目标:了解AI大模型的基本概念、发展历程和核心原理。
-
内容:
- L1.1 人工智能简述与大模型起源
- L1.2 大模型与通用人工智能
- L1.3 GPT模型的发展历程
- L1.4 模型工程
- L1.4.1 知识大模型
- L1.4.2 生产大模型
- L1.4.3 模型工程方法论
- L1.4.4 模型工程实践
- L1.5 GPT应用案例
阶段2:AI大模型API应用开发工程
-
目标:掌握AI大模型API的使用和开发,以及相关的编程技能。
-
内容:
- L2.1 API接口
- L2.1.1 OpenAI API接口
- L2.1.2 Python接口接入
- L2.1.3 BOT工具类框架
- L2.1.4 代码示例
- L2.2 Prompt框架
- L2.3 流水线工程
- L2.4 总结与展望
阶段3:AI大模型应用架构实践
-
目标:深入理解AI大模型的应用架构,并能够进行私有化部署。
-
内容:
- L3.1 Agent模型框架
- L3.2 MetaGPT
- L3.3 ChatGLM
- L3.4 LLAMA
- L3.5 其他大模型介绍
阶段4:AI大模型私有化部署
-
目标:掌握多种AI大模型的私有化部署,包括多模态和特定领域模型。
-
内容:
- L4.1 模型私有化部署概述
- L4.2 模型私有化部署的关键技术
- L4.3 模型私有化部署的实施步骤
- L4.4 模型私有化部署的应用场景
这份 LLM大模型资料
包括LLM大模型书籍、640套大模型行业报告、LLM大模型学习视频、LLM大模型学习路线、开源大模型学习教程
等, 😝有需要的小伙伴,可以 扫描下方二维码领取🆓↓↓↓