DeepSeek+ragflow构建企业知识库之工作流，突然觉的dify又香了

程序员一粟

于 2025-05-02 10:47:22 发布

阅读量902

点赞数 28

文章标签：数据库人工智能计算机视觉深度学习开源

本文链接：https://blog.csdn.net/jennycisp/article/details/147660733

版权

基础组件介绍

我们按照下图的数据介绍组件。

Begin（开始）组件

• 启动工作流：Begin组件是工作流中的起始组件，自动出现在画布上，不能被删除。原文
• 设置开场白或接受输入：可以设置开场白或接受用户输入的全局变量。

• 在开始节点中，我们通过2设置agent的开白场
• 通过点击3新增变量（需要注意的是，ragflow的变量是全局变量）
• 打开变量设置对话框以后,我们可以通过4设置输入框的类型

Retrieval（知识检索）组件

此组件用于从知识库中检索相关信息。选择知识库。如果没有检索到任何内容，将返回“空响应”。

•
- • 新增输入变量3：有两种类型的输入变量——引用和文本。引用e使用组件输出或用户输入作为数据源，Text使用固定文本作为查询。没有dify丰富，而且还有个问题，引用的时候能看到所有的变量
• 4相似度阈值：设置用户查询与数据集中存储的块之间的相似度阈值，默认值为0.2
• 关键词相似度权重5：设置关键词相似度在综合相似度得分中的权重，默认值为0.7，向量相似度的权重为0.3。
• Top N6：从检索到的块中选择“Top N”块并传递给LLM，默认值为8。
• 重排模型7：可选，如果选择了重排模型，将使用加权关键词相似度和加权重排得分进行检索，但这会显著增加系统的响应时间。
• 知识库8:可以选择多个知识库，如果选择多个，必须保证它们使用相同的嵌入模型，否则会出现错误信息
• 空回复9:如果没有检索到数据，回复设置的默认值

Generate（生成回答）组件

此组件用于调用LLM生成文本，请注意提示词的设置。

• 在生成回答组件1中,我们通过2可以修改修改组件的id
• 通过3调整组件使用的模型，可以选择已经配置的模型服务
- • ragflow给了我们三组参数4用来控制模型的自由度，可以减少我们的思考
- • 需要注意的是，我们需要关注下最大Token根据自己的业务来即可。
- • 存在惩罚（Presence penalty）：鼓励模型在响应中包含更多样化的标记，默认值为0.4
- • 频率惩罚（Frequency penalty）：阻止模型在生成的文本中过于频繁地重复相同的单词或短语，默认值为0.7
• 系统提示词6,通过提示词我们来指定模型的能力，一般会结合输入，需要注意的是ragflow不能通过{来快捷的获取变量引用
• 引用，主要用于多轮会话，是否引用以前的内容，12是引用多少个窗口，这个和token相结合
• 通过7新增变量以后，才可以在组件内使用，和dify一样

Interact（对话）组件

该组件用作机器人与人类之间的接口。它接收用户的输入并显示机器人的计算结果。

Categorize（问题分类）组件

此组件用于对文本进行分类。请指定类别的名称、描述和示例。每个类别都指向不同的下游组件。问题分类，你可以理解为是条件判断的增强，条件判断是基于具体的值，问题分类是使用大模型根据问题描述，以及示例，推导出的分类，并指向对应的流程。

• 引用节点输出1并不是一个结构化的输出，
• 模型参数的调整和生成回答一样
• 通过3和4、5设置大概什么情况归到这个分类。

Message （静态消息）组件

此组件用于向用户发送静态信息。您可以准备几条消息，这些消息将被随机选择。

Rewrite（问题优化）组件

此组件用于细化用户的提问。通常，当用户的原始提问无法从知识库中检索到相关信息时，此组件可帮助您将问题更改为更符合知识库表达方式的适当问题。

keyword( 关键词 )组件

该组件用于从用户的问题中提取关键词。Top N指定需要提取的关键词数量。比如用于我们之前的从数据库查询知识的场景，不用我们去处理了。

Switch（条件）组件

该组件用于根据前面组件的输出评估条件，并相应地引导执行流程。通过定义各种情况并指定操作，或在不满足条件时采取默认操作，实现复杂的分支逻辑。

这里可以通过引用组件的输出值作为比较条件，可以添加多个条件，且支持逻辑操作符。

Concentrator（集线器）组件

该组件可用于连接多个下游组件。它接收来自上游组件的输入并将其传递给每个下游组件。

在ragflow中，有些节点的输出，只能指向一个节点，如果你需要并行操作的时候，需要添加集线器。

Template（模板转换）组件

该组件用于排版各种组件的输出。有助于将各种数据或信息源组织成特定格式，便于后续处理和展示

• 1、支持Jinja2模板,会先将输入转为对象后进行模版渲染
• 2、同时保留原使用{参数}字符串替换的方式

（循环）组件

该组件首先将输入以“分隔符”分割成数组，然后依次对数组中的元素执行相同的操作步骤，直到输出所有结果，可以理解为一个任务批处理器。例如在长文本翻译迭代节点中，如果所有内容都输入到LLM节点，可能会达到单次对话的限制，上游节点可以先将长文本分割成多个片段，配合迭代节点对每个片段进行批量翻译，避免达到单次对话的LLM消息限制。