dify实现原理分析-rag-检索(Retrieval)服务的实现

一铭

已于 2025-02-20 14:25:35 修改

阅读量1.1k

点赞数 17

分类专栏：大模型(LLM) 文章标签：大模型 LLM 人工智能

于 2025-01-30 11:06:14 首次发布

本文链接：https://blog.csdn.net/zg_hover/article/details/145397991

版权

本文对dify的检索服务的检索过程的实现逻辑进行了分析。通过本文可以对检索服务的检索过程有一个比较清晰的理解，若是要关注实现细节，可以阅读对应部分的代码。

dify实现了三种类型的检索

检索的类型定义如下：

class RetrievalMethod(Enum):
    SEMANTIC_SEARCH = "semantic_search"
    FULL_TEXT_SEARCH = "full_text_search"
    HYBRID_SEARCH = "hybrid_search"

在进行检索的过程中，会根据检索类型来执行不同的流程。

检索服务的实际执行过程在RetrievalService.retrieve(…)函数中实现。该函数的主要实现逻辑如下：

若检索方法为关键词检索（retrieval_method == "keyword_search"），启动关键词检索线程，来根据查询语句来查询相关文档。结果保存到all_documents中。
若检索服务支持语义检索（is_support_semantic_search），则根据参数query查询嵌入向量，返回top_k个最相似的documents。结果保存到all_documents中。
若检索服务支持全文检索（is_support_fulltext_search），则根据参数query在对应向量数据库中进行全文检索。注意，有些向量数据库不支持全文检索。结果保存到all_documents中。
若检索方法是混合检索retrieval_method == RetrievalMethod.HYBRID_SEARCH.value，则启动数据后处理相关流程。结果保存到all_documents中。