DeepSeek+Dify构建知识库、聊天助手、Agent(智能体)、工作流

大模型学习

于 2025-05-08 14:53:56 发布

阅读量1k

点赞数 18

文章标签：人工智能大数据产品经理 langchain 服务器大模型

本文链接：https://blog.csdn.net/CSDN_430422/article/details/147792657

版权

昨天看到一个网友说"不会使用DeepSeek，那么这东西到普通人手里，就是百度Plus版"，这么说也不无道理。为什么DeepSeek会掀起这么大的浪潮，是因为过去我们想实现的很多事情都要基于机器对自然语言的理解，比如机器人发展了很久，现在有了机器狗、人形机器人，但还是需要遥控去控制，而不具备自主思维。再比如刚出来的Gpt、文心一言，更像是拼凑起来的文字，具有浓重的程序化风格。

DeepSeek的优势就在于其推理模型，能够从用户角度出发，分析用户为什么提出这个问题，用户需要达成什么样的目标，以及在回答过程中需要注意什么。这就给很多领域提供了AI驱动的能力，比如散户也可以拥有属于自己的股票分析专家，公司可以基于DeepSeek将传统业务升级为AI驱动，用户只需要一句话就可以得到想要的结果，即使不能做到百分百满意，那也在效率提升上做到了突破。

今天的这篇文章之所以说这么多，是为了交代背景，个人如何深度利用包括DeepSeek在内的AI工具，如何使用构建自己的聊天助手、智能体、工作流来提升工作效率。接下来我将会用系列文章教会你深度利用AI。

Dify

Dify平台简单来说，就是一个让普通人无需编程就能快速搭建职能助手或自动化流程的AI工具平台，像拼积木一样简单。Dify平台能够整合知识库、AI模型和工具，自动处理复杂任务（如回答咨询、分析数据），并像人一样学习和优化效果。

1、Dify的部署

Dify支持Linux或MacOS，Windows用户可能需要使用WSL（Windows Subsystem for Linux）。如果大家没有编程能力或者linux环境的话，我也给大家提供了一个我自己在虚拟机上部署的镜像，里面已经用Docker安装了Dify和DeepSeek，大家可以下载下，将镜像导入到虚拟机中即可使用，链接我就放在文末了。如果需要技术支持，也可以后台回复“交友”，获取我的联系方式。

2、Dify的主要功能

探索页面

探索页面是展示Dify中内置的一些能力，有助手、写作、编程、人力资源等方面的智能体、工作流、聊天助手。当自己对于Dify无从下手时，可以使用这些能力先试试看。

工作室

工作室中包括了聊天助手、Agent、工作流，可以在工作室中根据自己的需求创建相关应用。后面会对该功能做详细解释

知识库

知识库中可以上传个人或企业的文件，上传之后如果设置了嵌入向量模型，会将文本转换为向量数据，用于后续相似性检索。

工具

Dify的工具是指一些让AI调用外部功能的插件，比如搜索、发微信或者查询数据，就像给AI装上手和脚，能自动执行现实任务。也可以自定义工具给Dify调用，或者将已发布的工作流发布成工具进行使用。

知识库

知识库是存储企业或个人资料的数据仓库，用于辅助AI精准回答专业问题。原理是将文档拆分、向量化存储，通过检索匹配用户问题，结合大模型生成可靠答案。

1、创建知识库

2、选择数据源

数据源可选导入已有文本、同步自Notion内容、同步自Web站点（暂未上线）

导入已有文本：即你需要作为外部知识让大模型去检索回答的内容，可能是个商业计划模板、也可能是个销售数据表。

同步自Notion内容：Notion是一款团队协作工具，类似于钉钉文档、语雀文档等，可以在其中以高度自定义的方式组织工作、管理项目和存储信息。也有提供API给其他应用调用。这里就是Dify对接了Notion，可以从Notion中导入信息到知识库中

3、文本分段与清洗

此步骤主要是对上传的文档进行分段以及向量转换

4、处理并完成

此步骤可以修改知识库名称

5、查看文档

在列表中可以查看刚刚上传的文档，如果文件比较大，状态可能还是“索引中”，正常是“可用”，右侧也可以进行分段设置、归档等操作。

6、召回测试

向量检索

上传文档之后我们可以在召回测试窗口问个问题，已测试下命中率吧。我根据文档内容问了“DeepSeek是什么？”，并以向量检索的方式进行检索，命中三个分段

如果我问一个不相关的问题，通过向量检索的方式也是可以找到的，但实际结果可能没那么理想

全文检索

当我切换为全文检索时，其搜索效果竟然更准确

混合检索

混合检索需要设置一个重排序模型，如果本地没有安装的话，可以选择使用jina的API。

选择添加之后会跳出一个弹窗，可以点击“从Jina获取API Key”

进入官网，无需注册登录，点击API

查看API密钥

复制填充即可

设置完成，等几秒钟加载即可，点击保存

查看结果

使用混合检索，查询出来的结果相对精确一些，经过重排序模型排序之后，结果会以相似度排序展示。

聊天助手

聊天助手是直接和用户对话的AI，通过大模型理解问题并生成回复。原理是实时调用AI模型分析上下文，用自然语言交互解决咨询、问答等需求。

输入应用名称，点击创建

编排

进入编排页面

既然我们是聊天机器人，先设置一个开场白，点击开启，我是设置成了“欢迎来到DeepSeek的世界”

设置知识库为上下文

记得点击右上角的更新、发布，否则修改将不会生效

我们来问下“DeepSeek是什么”，回答就是基于知识库来的

可以根据知识库中的测试来验证下

访问API

当我们配置完成之后，可以通过API嵌入到应用中

API使用需要密钥，右上角创建即可

日志与标注

日志记录了应用的运行情况

概览

概览就是看下API的使用情况

至此，聊天助手算是基本创建完成，需要更完整的能力，就需要你来自己尝试下了。

Agent(智能体或智能代理)

Agent是能自动处理复杂任务的AI助手，比如查数据或操作其他软件。原理是预设规则或学习用户目标，拆解任务后调用工具（搜索、API）自主完成

输入应用名称，点击创建

编排

输入提示词，即你希望这个智能体帮你完成什么任务

选择工具，智能体就是让AI使用工具完成任务的具体存在，所以会有很多工具可选

当然，如果你懂编程，也可以自定义工具

选择完工具，点击右上角的更新发布即可完成

我们来测试下吧，我创建的是个股票分析智能体，我问了下“大前天苹果的股价情况”

思考的过程中会发现已经在使用工具，时间工具和股票分析工具

哎，你猜怎么着，它没回答出来，不管它了，我的电脑也就这样了，只要大概的流程说清楚就行

工作流

工作流是把多个AI步骤串联起来的自动化流水线，比如先分类再生成内容。原理是用可视化流程编排不同工具和模型，按顺序执行任务，像工厂流水线一样协作。

选择工作流，输入应用名称，点击创建即可

编排

默认进来展示开始节点和下一节点选择

在开始节点设置下变量，也就是我们要进行对话，工作流需要接收到我们问的内容，需要有个参数来接收

这里我选择段落，因为文本的字数有限，段落字数默认最大33024，命名为message

第二个节点选择知识检索，引入我们创建的知识库

知识库检索的内容将会作为输出变量输出，同时也会作为输入变量被下一节点使用

第三个节点选择大语言模型LLM，需要切换模型至deepseek

LLM中接收上一节点的输出参数，并设置提示词

LLM的输出参数也将作为输入参数被下一节点使用

最后的节点选择结束节点

选择大模型输出的变量即可

点击右上角的更新、发布，再点击运行

输入“DeepSeek是什么”，将会根据知识库信息进行返回

我们通过知识库中的分段信息确认下其是否使用知识库回答

访问API

Dify提供了对应的工作流API，可以嵌入到应用中进行使用，方法与前面介绍的聊天助手相似

日志及概览

日志和概览也都是对API的监控，不做过多介绍

至此，工作流也介绍完了

上面的流程基本涵盖了Dify的基本功能，也包括了DeepSeek的深度使用，例子很简单，但想要真正提效，还需要结合自身业务深入实践

那么，如何系统的去学习大模型LLM？

作为一名从业五年的资深大模型算法工程师，我经常会收到一些评论和私信，我是小白，学习大模型该从哪里入手呢？我自学没有方向怎么办？这个地方我不会啊。如果你也有类似的经历，一定要继续看下去！这些问题啊，也不是三言两语啊就能讲明白的。

所以我综合了大模型的所有知识点，给大家带来一套全网最全最细的大模型零基础教程。在做这套教程之前呢，我就曾放空大脑，以一个大模型小白的角度去重新解析它，采用基础知识和实战项目相结合的教学方式，历时3个月，终于完成了这样的课程，让你真正体会到什么是每一秒都在疯狂输出知识点。

由于篇幅有限，⚡️ 朋友们如果有需要全套《2025全新制作的大模型全套资料》，扫码获取~
在这里插入图片描述

👉大模型学习指南+路线汇总👈

我们这套大模型资料呢，会从基础篇、进阶篇和项目实战篇等三大方面来讲解。
在这里插入图片描述

👉①.基础篇👈

基础篇里面包括了Python快速入门、AI开发环境搭建及提示词工程，带你学习大模型核心原理、prompt使用技巧、Transformer架构和预训练、SFT、RLHF等一些基础概念，用最易懂的方式带你入门大模型。
在这里插入图片描述

👉②.进阶篇👈

接下来是进阶篇，你将掌握RAG、Agent、Langchain、大模型微调和私有化部署，学习如何构建外挂知识库并和自己的企业相结合，学习如何使用langchain框架提高开发效率和代码质量、学习如何选择合适的基座模型并进行数据集的收集预处理以及具体的模型微调等等。
在这里插入图片描述

👉③.实战篇👈

实战篇会手把手带着大家练习企业级的落地项目（已脱敏），比如RAG医疗问答系统、Agent智能电商客服系统、数字人项目实战、教育行业智能助教等等，从而帮助大家更好的应对大模型时代的挑战。
在这里插入图片描述

👉④.福利篇👈

最后呢，会给大家一个小福利，课程视频中的所有素材，有搭建AI开发环境资料包，还有学习计划表，几十上百G素材、电子书和课件等等，只要你能想到的素材，我这里几乎都有。我已经全部上传到CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】
在这里插入图片描述
相信我，这套大模型系统教程将会是全网最齐全最易懂的小白专用课！！