来自工业界的知识库 RAG 服务(五)，模块化知识库 GoMate 实现方案详解

最新推荐文章于 2025-04-11 10:02:30 发布

易迟

最新推荐文章于 2025-04-11 10:02:30 发布

阅读量1.7k

点赞数 18

分类专栏：人工智能文章标签： python 人工智能 gpt

本文链接：https://blog.csdn.net/hustyichi/article/details/139941609

版权

很早以前就看过一篇介绍 RAG 的综述性文章 Retrieval-Augmented Generation for Large Language Models: A Survey, 其中介绍了 RAG 的模块化架构：
请添加图片描述

但是一直没有看到对应的实现方案，以前也没有理解此框架的优势之处。随着在相关领域的持续实践，逐渐理解到模块化 RAG 的优势。模块化 RAG 可以方便地进行服务的迭代升级，另外模块可以自由组合，灵活性更好。

最近注意到来自中科院的 RAG 服务 GoMate 开源了，核心亮点就是模块化 RAG 设计，本文就深入介绍来 GoMate 的框架设计与实现细节。

之前介绍的 RAG 框架存在着不同的侧重点，来自有道的 QAnything 强调其 Rerank 设计，RagFlow 强调其精细的文件处理。而 GoMate 则主要强调其模块化设计。

GoMate 的框架设计图如下所示：

请添加图片描述

可以看到，框架中将 RAG 流程拆分为不同模块，熟悉 RAG 服务还是比较容易理解的，一些核心模块如下所示：

每个模块可以存在多种不同的实现形式，比如 Retrieval 图中包含如下所示的实现：

从架构图可以看到 GoMate 就是包含了多个基础的功能模块，通过功能模块的的组合实现具体的应用。

GoMate 是从 2024 年 2 月开始开发的，截止目前经过了 4 个月的开发，虽然功能还不够完善，但是已经可以看到模块化的完整设计思想了。

项目主要包含两部分:

每个模块对应的职责比较明确，以 RAG 中核心的检索模块为例，深入查看对应的实现：

基础的检索接口在 gomate/modules/retrieval/base.py 中定义，只包含一个 retrieve() 方法：

class BaseRetriever(ABC):
    @abstractmethod
    def retrieve(self, query: str) -> str:
        pass

BM25 检索算法在 gomate/modules/retrieval/bm25_retriever.py 实现，其中实现了 BM25Okapi, BM25L 和 BM25Plus 版本的算法，具体如下所示：

class BM25Retriever(BaseRetriever):
    # 实现不同的 BM25 算法

    def build_from_texts(self, corpus):