RAG优化

最新推荐文章于 2025-12-20 19:32:34 发布

原创最新推荐文章于 2025-12-20 19:32:34 发布 · 281 阅读

·

7

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#人工智能 #RAG #重排序 #MCP #大模型

AIGC 专栏收录该内容

31 篇文章

订阅专栏

RAG搭建本地AI知识库，在使用过程中遇到的三大痛点，以及相应的进阶方案。

1. RAG知识库的三大痛点

--

内容理解不足：

AI难以全面理解导入资料的内容，比如在向量编码时候，生硬的截断等导致分析结果不理想。

eg: 知识库分割器造成截断。

信息提取不准确：

AI在提取关键信息时可能存在偏差，RAG靠输入的检索字符的向量编码，和知识库中的向量编码对比，影响最终结论的准确性。

综合分析能力有限：

AI无法像人类一样进行复杂的逻辑推理和综合分析，导致结论缺乏深度。

比如：一个excel文档，有300条数据，因为rag切分之后，无法求出整个文档的最大或最小值

2. 进阶方案

引入重排序模型：

通过优化内容的排序逻辑，提高信息提取的准确性。

使用数据库MCP Server：

利用MCP（Model Context Protocol）技术，增强AI知识库的存储和处理能力。

比如：使用postgre mcp server，连接数据库，进行数据的分析。

借助超大上下文模型：

通过扩展模型的上下文能力，提升AI对复杂内容的理解与分析能力。

现在大模型的发展，prompt 长度越来越长，可以直接把整个文档或者资料库，投给大模型。

5. 实用工具和资源

CherryStudio下载：用户可以通过Cherry-ai.com下载CherryStudio。
硅基流动：访问硅基流动获取更多模型资源。
PostGreSQL MCP：通过GitHub上的PostGreSQL MCP了解更多MCP相关技术。

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。