【RAG进阶实践】引入Rerank技术,让RAG效果更上一层楼

本文介绍了RAG检索增强生成技术,特别是如何通过引入Rerank技术来提高知识检索和生成的效率和准确性。文章详细阐述了Rerank的工作原理、LlamaIndex框架以及大语言模型的选型,并提供了环境配置指导。最后,还预告了关于AI大模型开发的直播课程和知识图谱的赠送。
摘要由CSDN通过智能技术生成

▼最近直播超级多,预约保你有收获

44744b53d22cff13da395c43f39b11f3.png

RAG 检索增强生成技术这篇《一文搞懂 RAG 检索增强生成》做了详细介绍,一个典型的 RAG 案例如下图所示,包含3个步骤

  • 索引:将文档库分割成较短的 Chunk,并通过 Embedding 编码器构建向量索引。

  • 检索: 根据 Prompt 问题和 Chunks 的相似度检索相关文档片段。

  • 生成 :以检索到的上下文为增强条件,最终生成 Prompt 问题的回答。

9901d7e2937b0020bc83414848a64e21.png

今天我们聊聊引入 Rerank 技术如何进一步增强 RAG 应用落地的效果。

 1

Rerank + RAG 增强落地

Rerank 是一种重排序技术,通过引入 Rerank,可以在不牺牲准确性的情况下加速大模型的查询(实际上可能提高准确率),Rerank 通过从上下文中删除不相关的节点,重新排序相关节点来实现这一点,如下图所示:

011424768137758bb27db7123be7f300.png

下面详细剖析下 Rerank + RAG 技术,有效地缓解了幻觉问题,提高了知识更新的速度,并增强了内容生成的可追溯性,使得大语言模型在实际应用中变得更加实用和可信。

第一、 Rerank 模型技术及选型

与 Embedding 模型不同,Rerank 使用问题和文档作为输入,直接输出相似度而不是 Embedding 向量。通过向 Rerank 模块输入查询和段落来获得相关性分数。Rerank 往往基于交叉熵损失进行优化的,因此相关性得分不受特定范围的限制。bge-reranker-v2-m3 适用于中英文双语 Rerank 场景。

Rerank 的工作(如下图)就像是一个智能的筛选器,当 RAG 从文档集合中检索到多个文档时,这些文档可能与你的问题相关度各不相同。有些文档可能非常贴切,而有些则可能只是稍微相关或者甚至是不相关的。这时,Rerank 的任务就是评估这些文档的相关性,然后对它们进行重新排序。它会把那些最有可能提供准确、相关回答的文档排在前面。这样,当大模型开始生成回答时,它会优先考虑这些排名靠前的、更加相关的文档,从而提高生成回答的准确性和质量。通俗来说,Rerank 就像是在图书馆里帮你从一堆书中挑出最相关的那几本,让你在寻找答案时更加高效和精准。

25de045daa93c7dcbb93cf7c190f808e.png

第二、RAG 框架:LlamaIndex

LlamaIndex 是一个基于大语言模型应用的数据框架,用于增强大语言模型的能力。 这种基于大语言模型的应用被称为 RAG 应用,对标微调(Fine-tuning)技术。LlamaIndex 提供了必要的抽象,可以更轻松地获取、索引、存储和访问私有或特定领域的企业级数据,以便将这些数据安全可靠地注入大语言模型中,以实现更准确的知识生成。

d54b352eebeb23270b5d3ca69a37878f.png

第三、LLM 大语言模型选型

在做知识增强时,根据不同的任务,需要的大语言模型的能力是不同的,比如:分类任务选用 3B 参数量,翻译任务选用 7B 参数量,意图识别选用 13B 参数量,Action 函数调用(Function Calling)选用 70B 参数量

在以上实践原则下,对于闭源大模型可以考虑:OpenAI ChatGPT 系列和百度文心一言系列。对于开源大模型可以考虑:阿里 Qwen 1.5、智谱 ChatGLM3、百川3、Llama 2 以及 xAI 最新推出的参数量为 314B 的Grok 1.5和 Databricks 开源的 132B 参数量的 DBRX。

eec0743f10248781f9425d8d9ec92989.png

第四、RAG + Rerank 环境配置与安装

  • Python 3.10 及以上版本

  • Pytorch 1.12 及以上版本,推荐 2.0 及以上版本

  • 建议使用 CUDA 11.4及以上

  • 详细配置参考这里:https://github.com/modelscope/modelscope-classroom/blob/main/LLM-tutorial/RAG%2BRerank%2BLlamaindex.ipynb

为了帮助同学们彻底掌握大模型的 RAG、Agent 智能体、向量数据库的应用开发、部署、生产化,今晚20点我会开一场直播和同学们深度剖析,请同学们点击以下预约按钮免费预约

 2

!送!AI大模型开发直播课程

大模型的技术体系非常复杂,即使有了知识图谱和学习路线后,快速掌握并不容易,我们打造了大模型应用技术的系列直播课程,包括:通用大模型技术架构原理、大模型 Agent 应用开发、企业私有大模型开发、向量数据库、大模型应用治理、大模型应用行业落地案例等6项核心技能,帮助同学们快速掌握 AI 大模型的技能。

 🔥即将开播 

立即扫码,即可免费预约

进入直播,大佬直播在线答疑!

1eb27332780b2e8b0fe678c32b37c176.gif

1751584c4968df7a91a1c6b1161026b8.png

本期名额有限

高度起始于速度(手慢无!!)

 3

!!再送!!《AI 大模型技术知识图谱

最近很多同学在后台留言:“玄姐,AI 大模型技术的知识图谱有没?”、“AI 大模型技术有学习路线吗?”

我们倾心整理了 AI 大模型技术的知识图谱快来领取吧!

61124d2b7077bc28e2636ea42c2d79a3.png

这份业界首创知识图谱和学习路线,今天免费送给大家一份!

只需要以下3步操作就可免费领取:

第一步长按扫码以下我的视频号:玄姐谈AGI

bd5d8bcfb4584bf600a775d41e962b97.png

第二步:扫码后,点击以下关注按钮,就可关注我。

ee6e04b45c4f6d494d72ef240c17ccc0.jpeg

第三步:点击"客服“按钮,回复知识图谱即可领取。

2b573abed19db2f78ebda9f2a4366c62.jpeg

END

  • 9
    点赞
  • 23
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值