15种高级RAG技术(四)生成优化(思维链、通过 Self-RAG 使系统具备自我反思能力、通过微调忽略不相关内容)

四、生成优化

生成优化包括改进生成最终用户响应的大型语言模型调用。这里最容易实现的成果是迭代提示并确定插入到生成提示中的最佳分块数量。我们使用 GPT-4 对 1000、3500 和 7000 个 token 的检索上下文 / 分块进行了 A/B 测试。我们发现,将 3500 个 token 的检索上下文插入到检索增强生成(RAG)提示中比其他选项略好。我们怀疑这个发现并非普遍适用,每个用例都有不同的最佳数量。在这一点上,可以考虑评估和改进大型语言模型适当处理它可能接收的不同类型文档(相关的、有关联的、不相关的等)的能力。理想情况下,一个 retrieval-robust 的 LLM 系统应当具备以下特性:

  • 当检索到的上下文相关时,应提高模型性能。
  • 当检索到的上下文不相关甚至与事实相反时,不应损害模型性能。
  • 未知稳健性:当 LLM 收到一个它没有相应知识来回答的查询,并且在检索到的文档中未找到相关信息时,以‘未知’回应来承认其局限性的能力。

1、思维链

思维链(Chain-of-thought, CoT)提示通过推理增加了在存在噪声或无关上下文的情况下,LLM 得出正确响应的可能性。研究人员 Wenhao Yu 等人进一步发展了这一理念,提出了链式笔记(chain-of-noting[5]),他们微调了一个模型以生成“每个检索到的文档的连续阅读笔记。这一过程允许对文档与所提问题的相关性进行深入评估,并有助于综合这些信息以构建最终答案。”微调的模型是 LLaMA-7B,训练数据是使用 ChatGPT 创建的。

2、通过 Self-RAG 使系统具备自我反思能力

Self-RAG 是另一种基于微调的方法,其中语言模型在生成过程中被训练输出特殊的反思标记。反思标记可以是检索标记或批评标记。研究人员 Asai 等人详细描述了他们的方法:

“给定一个输入提示和之前的生成内容,Self-RAG 首先确定是否通过检索到的段落来增强后续生成会有所帮助。如果是,它会输出一个检索标记,按需调用检索模型。随后,Self-RAG 并行处理多个检索到的段落,评估其相关性,然后生成相应的任务输出。接着,它生成批评标记来批评自己的输出,并选择在事实性和整体质量方面最好的一个。”

3、通过微调忽略不相关内容

鉴于 LLM 通常没有明确地为 RAG 进行训练或调优,因此可以对模型进行微调以适应这种用例,合理地说可以提高模型忽略无关上下文的能力。论文《Making Retrieval-Augmented Language Models Robust to Irrelevant Context[6]》通过实验证明,即使是 1,000 个例子也足以训练模型,使其在面对无关上下文时保持鲁棒性,同时在有相关上下文的例子上保持高性能。

此论文还探索了使用自然语言推理(NLI)模型来识别无关的上下文。由于有些情况下无关的 RAG 上下文会对 LLM 的性能产生负面影响。NLI 模型可以用来过滤掉无关的上下文。这种技术的工作原理是,仅在假设(即使用问题和 LLM 生成的答案)被分类为由前提(即检索到的上下文或 RAG 结果)所蕴涵时,才使用检索到的上下文。

五、其他 Advanced RAG 策略

关于 RAG 的文献非常广泛且不断扩展。

  • 微调 embedding 模型
  • 使用知识图谱(即 GraphRAG[7])
  • 使用长上下文 LLM(例如 Gemini 1.5 或 GPT-4 128k)代替分块和检索

六、总结

随着检索增强生成(RAG)系统的快速发展,它为增强对话式 AI 和其他生成式 AI 应用提供了许多机会。本文的实验和研究突显了先进的 RAG 技术在以下方面的潜力:

  • 信息密度
  • 检索准确性
  • 用户响应质量

如果正确实施,这些技术可以为企业带来更高的成本效益,并改善客户体验。但为了跟上快速涌现的最佳实践,软件工程师和数据科学家需要及时、可信赖的资源作为参考。


最后分享

AI大模型作为人工智能领域的重要技术突破,正成为推动各行各业创新和转型的关键力量。抓住AI大模型的风口,掌握AI大模型的知识和技能将变得越来越重要。

学习AI大模型是一个系统的过程,需要从基础开始,逐步深入到更高级的技术。

这里给大家精心整理了一份全面的AI大模型学习资源,包括:AI大模型全套学习路线图(从入门到实战)、精品AI大模型学习书籍手册、视频教程、实战学习、面试题等,资料免费分享!

在这里插入图片描述

1. 成长路线图&学习规划

要学习一门新的技术,作为新手一定要先学习成长路线图方向不对,努力白费

这里,我们为新手和想要进一步提升的专业人士准备了一份详细的学习成长路线图和规划。可以说是最科学最系统的学习成长路线。
在这里插入图片描述

2. 大模型经典PDF书籍

书籍和学习文档资料是学习大模型过程中必不可少的,我们精选了一系列深入探讨大模型技术的书籍和学习文档,它们由领域内的顶尖专家撰写,内容全面、深入、详尽,为你学习大模型提供坚实的理论基础。(书籍含电子版PDF)

在这里插入图片描述

3. 大模型视频教程

对于很多自学或者没有基础的同学来说,书籍这些纯文字类的学习教材会觉得比较晦涩难以理解,因此,我们提供了丰富的大模型视频教程,以动态、形象的方式展示技术概念,帮助你更快、更轻松地掌握核心知识

在这里插入图片描述

4. 大模型项目实战

学以致用 ,当你的理论知识积累到一定程度,就需要通过项目实战,在实际操作中检验和巩固你所学到的知识,同时为你找工作和职业发展打下坚实的基础。

在这里插入图片描述

5. 大模型面试题

面试,不仅是技术的较量,更需要充分的准备。在你已经掌握了大模型技术之后,就需要开始准备面试,我们将提供精心整理的大模型面试题库,涵盖当前面试中可能遇到的各种技术问题,让你在面试中游刃有余。

在这里插入图片描述

全套的AI大模型学习资源已经整理打包,有需要的小伙伴可以微信扫描下方CSDN官方认证二维码,免费领取【保证100%免费

在这里插入图片描述

如有侵权,请联系删除。

  • 18
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值