传统 RAG 的缺点及 RAG 优化方向

塞大花

已于 2025-03-26 13:44:19 修改

阅读量888

点赞数 19

分类专栏： RAG 探索与实践文章标签：人工智能 RAG 检索增强生成 RAG技术 ai python GraphRAG

于 2025-03-11 13:05:51 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43837507/article/details/146176136

版权

传统RAG的架构

传统RAG的整体架构如下图所示：

核心链路分为三个阶段：

索引（向量嵌入）：通过Embedding模型服务实现文档的向量编码，写入向量数据库。
检索（相似查询）：通过Embedding模型服务实现查询的向量编码，使用相似性查询（ANN）实现topK结果搜索。
生成（文档上下文）：Retriver检索的结果文档作为上下文和问题一起提交给大模型处理

传统RAG的缺点

在《Seven Failure Points When Engineering a Retrieval Augmented Generation System》这篇论文中总结了在构建检索增强生成（RAG）系统时开发者常遇到的七个失败点，并针对每个问题提出了改进建议。

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

塞大花 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。