如何增强 Dify 的知识库检索能力？

再不会AI就不礼貌了

于 2024-09-02 11:16:26 发布

阅读量848

点赞数 12

文章标签： python 开发语言 langchain oracle 学习人工智能数据库

本文链接：https://blog.csdn.net/Everly_/article/details/141815128

版权

在上一篇文章对比过 Dify 和 fastGPT 之后，很明显的感受到了 Dify 在知识库检索方面的不足，但是 fastGPT 的一些功能以及大模型配置都比较麻烦，而且从功能的多样性上来说，Dify 还是比较有优势的。所以三金和小伙伴们都在想：有没有什么方法可以增强 Dify 的知识库检索功能呢？

首先我们知道，在 Dify 的知识库创建时，第二步「文本分段和清洗」 页面会有三个配置项，它们分别是：

分段设置
索引方式
检索设置

其中对于分段设置来说，如果不了解，可以默认选择「自动分段与清洗」。

而对于检索方式来说我们则可以选择「高质量检索」和「采用 Q&A 分段模式」：

调用系统默认的嵌入接口进行处理，以在用户查询时提供更高的准确度
Q&A 分段模式功能，是采用「Q to Q」（问题匹配问题）匹配工作，在文档经过分段后，经过总结为每一个分段生成 Q&A 匹配对，当用户提问时，系统会找出与之最相似的问题，然后返回对应的分段作为答案。这种方式更加精确，因为它直接针对用户问题进行匹配，可以更准确地获取用户真正需要的信息。（理所当然的，开启后将会消耗额外的 token）

问题文本是具有完整语法结构的自然语言，而不是文档检索任务中的一些关键字，所以 Q to Q （问题匹配问题）的模式会令语意和匹配更加清晰，并同时满足一些高频和高相似度问题的提问场景。

为了测试两个产品的知识库检索功能，三金其实都使用过 Q&A 分段的形式，不过这个分段模式会比较耗费时间，因为它首先会对文档进行分段，然后通过大模型总结再为每个分段生成 Q&A 匹配对。同一个文档，二者都花费了20分钟到半个小时左右的时间。

再接下来就是检索设置了，不同的索引方式提供了不同的检索设置，在高质量索引方式下，Dify 提供了三种方案：

向量检索，通过生成查询嵌入并查询与其向量表示最相似的文本分段。
全文检索，索引文档中的所有词汇，从而允许用户查询任意词汇，并返回包含这些词汇的文本片段。
混合检索，同时执行全文检索和向量检索，并附加重排序步骤，从两类查询结果中选择匹配用户问题的最佳结果，需配置 Rerank 模型 API。

Dify 官方是推荐混合检索模式，三金尝试了一下，确实还可以。尤其在 Rerank 模型之后，系统会在混合检索后对已召回的文档结果再一次进行语义重排序，优化排序结果。

综上，在不涉及其他优化手段的情况下，想要增强 Dify 知识库的检索能力，需要：

在分段设置中选择：自动分段与清洗
在索引方式中选择：高质量检索模式 + Q&A 分段模式（这个耗时会比较久）
在检索设置中，选择混合检索模式，并开启 Rerank 模型

在我们之前的配置中，LLM 选择的是 OpenAI 的 gpt4o-mini 模型，Embedding 模型为 text-embedding-3-large 模型，并没有 Rerank 模型。幸好 Dify 支持的大模型种类繁多，我们可以单独集成一个 Rerank 模型进来。

Jina AI

我们可以接入 Jina AI 来增强 Dify 知识库的检索能力。

在 Jina AI 的官网中对 Jina 的解释就一句话：

Your Search Foundation Supercharged

解释过来就是：你的搜索能力被极大地提升了。

而我们在 Dify 中使用 Jina AI 的向量检索和 Rerank 重排也确实可以极大地提升知识库检索能力。接下来三金就给大家演示一下：

如何申请 Jina AI 的 API Key
接入并使用 Jina AI 的 Embedding 模型以及 Rerank 模型

申请 API Key

Jina AI 的 API Key 申请非常简单，不需要注册登录，只需要访问他们的官方就会提供将近百万的免费 tokens 供你使用。

官网地址：Jina AI

在 Dify 中使用

Jina 还有一点好处就是国内可以直接使用！所以在 Dify 的模型配置对话框中，我们只需要填入 API key 就可以了。

Jina 支持的 Rerank 模型和 Embedding 模型也有很多：

我们可以将系统默认的 Embedding 模型和 Rerank 模型换成 Jina 中的：

那么在知识库中我们就可以使用 Jina 的向量模型和 Rerank 模型开始进行创建了。

知识库设置

我们之前已经创建过一个 K8s 相关的知识库了，这个知识库中的向量模型使用的是 OpenAI 的 text-embedding-3-large，并且为了方便测试，我又添加了一个微软用来测试知识库的 Word 文件：

在这里准备了三个问题：

Use Windows Hello to sign in
Charge your Surface Pro 4
Get to know Windows 10

然后让我们来看一下在这个知识库中的回答情况如何：

看起来还可以，每个回答都可以看到对应的引用。

接下来我们将 Jina 接入到知识库中：

创建一个新的知识库，在第一步中上传相同的测试文件
在第二步中设置 Embedding 模型为 jina-embeddings-v2-base-zh，以及设置 Rerank 模型为 jina-reranker-v2-base-multilingual
为了节省测试时间，就不使用 Q&A 方式进行分段了，我们直接开始创建

创建好之后我们提问相同的问题，对比一下结果：

Use Windows Hello to sign in
Charge your Surface Pro 4
Get to know Windows 10

看起大差不差，但细节决定成败，加入了 Rerank 之后的回答，每个问题都比之前的回答多了一些内容，而这只是在只有 8.9k 大小的文件上体现出来的，如果是体积更大的文件，我相信检索效果肯定会更加明显！👍

OK！以上就是今天要分享的内容了，想要加强 Dify 知识库检索能力的小伙伴赶快去试试吧～

如何学习大模型 AI ？

由于新岗位的生产效率，要优于被取代岗位的生产效率，所以实际上整个社会的生产效率是提升的。

但是具体到个人，只能说是：

“最先掌握AI的人，将会比较晚掌握AI的人有竞争优势”。

这句话，放在计算机、互联网、移动互联网的开局时期，都是一样的道理。

我在一线互联网企业工作十余年里，指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑，所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

😝有需要的小伙伴，可以Vx扫描下方二维码免费领取🆓

👉1.大模型入门学习思维导图👈

要学习一门新的技术，作为新手一定要先学习成长路线图，方向不对，努力白费。

对于从来没有接触过AI大模型的同学，我们帮你准备了详细的学习成长路线图&学习规划。可以说是最科学最系统的学习路线，大家跟着这个大的方向学习准没问题。（全套教程文末领取哈）
在这里插入图片描述

👉2.AGI大模型配套视频👈

很多朋友都不喜欢晦涩的文字，我也为大家准备了视频教程，每个章节都是当前板块的精华浓缩。

在这里插入图片描述

👉3.大模型实际应用报告合集👈

这套包含640份报告的合集，涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师，还是对AI大模型感兴趣的爱好者，这套报告合集都将为您提供宝贵的信息和启示。（全套教程文末领取哈）

在这里插入图片描述

👉4.大模型落地应用案例PPT👈

光学理论是没用的，要学会跟着一起做，要动手实操，才能将自己的所学运用到实际当中去，这时候可以搞点实战案例来学习。（全套教程文末领取哈）

在这里插入图片描述

👉5.大模型经典学习电子书👈

随着人工智能技术的飞速发展，AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型，如GPT-3、BERT、XLNet等，以其强大的语言理解和生成能力，正在改变我们对人工智能的认识。那以下这些PDF籍就是非常不错的学习资源。

在这里插入图片描述

👉6.大模型面试题&答案👈

截至目前大模型已经超过200个，在大模型纵横的时代，不仅大模型技术越来越卷，就连大模型相关的岗位和面试也开始越来越卷了。为了让大家更容易上车大模型算法赛道，我总结了大模型常考的面试题。

在这里插入图片描述

这份完整版的大模型 AI 学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【`保证100%免费`】

😝有需要的小伙伴，可以Vx扫描下方二维码免费领取🆓

再不会AI就不礼貌了

关注

12
点赞
踩
10

收藏

觉得还不错? 一键收藏
0
评论
如何增强 Dify 的知识库检索能力？

在上一篇文章对比过 Dify 和 fastGPT 之后，很明显的感受到了 Dify 在知识库检索方面的不足，但是 fastGPT 的一些功能以及大模型配置都比较麻烦，而且从功能的多样性上来说，Dify 还是比较有优势的。首先我们知道，在 Dify 的知识库创建时，其中对于。而对于问题文本是具有完整语法结构的自然语言，而不是文档检索任务中的一些关键字，所以 Q to Q （问题匹配问题）的模式会令语意和匹配更加清晰，并同时满足一些高频和高相似度问题的提问场景。
复制链接

扫一扫