DeepSeek+Dify构建知识库、聊天助手、Agent(智能体)、工作流

昨天看到一个网友说"不会使用DeepSeek,那么这东西到普通人手里,就是百度Plus版",这么说也不无道理。为什么DeepSeek会掀起这么大的浪潮,是因为过去我们想实现的很多事情都要基于机器对自然语言的理解,比如机器人发展了很久,现在有了机器狗、人形机器人,但还是需要遥控去控制,而不具备自主思维。再比如刚出来的Gpt、文心一言,更像是拼凑起来的文字,具有浓重的程序化风格。

DeepSeek的优势就在于其推理模型,能够从用户角度出发,分析用户为什么提出这个问题,用户需要达成什么样的目标,以及在回答过程中需要注意什么。这就给很多领域提供了AI驱动的能力,比如散户也可以拥有属于自己的股票分析专家,公司可以基于DeepSeek将传统业务升级为AI驱动,用户只需要一句话就可以得到想要的结果,即使不能做到百分百满意,那也在效率提升上做到了突破。

今天的这篇文章之所以说这么多,是为了交代背景,个人如何深度利用包括DeepSeek在内的AI工具,如何使用构建自己的聊天助手、智能体、工作流来提升工作效率。接下来我将会用系列文章教会你深度利用AI。

Dify

​ Dify平台简单来说,就是一个让普通人无需编程就能快速搭建职能助手或自动化流程的AI工具平台,像拼积木一样简单。Dify平台能够整合知识库、AI模型和工具,自动处理复杂任务(如回答咨询、分析数据),并像人一样学习和优化效果。

1、Dify的部署

Dify支持Linux或MacOS,Windows用户可能需要使用WSL(Windows Subsystem for Linux)。如果大家没有编程能力或者linux环境的话,我也给大家提供了一个我自己在虚拟机上部署的镜像,里面已经用Docker安装了Dify和DeepSeek,大家可以下载下,将镜像导入到虚拟机中即可使用,链接我就放在文末了。如果需要技术支持,也可以后台回复“交友”,获取我的联系方式。

2、Dify的主要功能

探索页面

探索页面是展示Dify中内置的一些能力,有助手、写作、编程、人力资源等方面的智能体、工作流、聊天助手。当自己对于Dify无从下手时,可以使用这些能力先试试看。

img

工作室

工作室中包括了聊天助手、Agent、工作流,可以在工作室中根据自己的需求创建相关应用。后面会对该功能做详细解释

img

知识库

知识库中可以上传个人或企业的文件,上传之后如果设置了嵌入向量模型,会将文本转换为向量数据,用于后续相似性检索。

img

工具

Dify的工具是指一些让AI调用外部功能的插件,比如搜索、发微信或者查询数据,就像给AI装上手和脚,能自动执行现实任务。也可以自定义工具给Dify调用,或者将已发布的工作流发布成工具进行使用。

img

知识库

​ 知识库是存储企业或个人资料的数据仓库,用于辅助AI精准回答专业问题。原理是将文档拆分、向量化存储,通过检索匹配用户问题,结合大模型生成可靠答案。

1、创建知识库

img

2、选择数据源

​ 数据源可选导入已有文本、同步自Notion内容、同步自Web站点(暂未上线)

​ 导入已有文本:即你需要作为外部知识让大模型去检索回答的内容,可能是个商业计划模板、也可能是个销售数据表。

​ 同步自Notion内容:Notion是一款团队协作工具,类似于钉钉文档、语雀文档等,可以在其中以高度自定义的方式组织工作、管理项目和存储信息。也有提供API给其他应用调用。这里就是Dify对接了Notion,可以从Notion中导入信息到知识库中

img

3、文本分段与清洗

​ 此步骤主要是对上传的文档进行分段以及向量转换

img

img

img

4、处理并完成

​ 此步骤可以修改知识库名称

img

5、查看文档

​ 在列表中可以查看刚刚上传的文档,如果文件比较大,状态可能还是“索引中”,正常是“可用”,右侧也可以进行分段设置、归档等操作。

img

img

6、召回测试

向量检索

​ 上传文档之后我们可以在召回测试窗口问个问题,已测试下命中率吧。我根据文档内容问了“DeepSeek是什么?”,并以向量检索的方式进行检索,命中三个分段

img

如果我问一个不相关的问题,通过向量检索的方式也是可以找到的,但实际结果可能没那么理想

img

全文检索

当我切换为全文检索时,其搜索效果竟然更准确

img

img

混合检索

混合检索需要设置一个重排序模型,如果本地没有安装的话,可以选择使用jina的API。

img

选择添加之后会跳出一个弹窗,可以点击“从Jina获取API Key”

img

进入官网,无需注册登录,点击API

img

查看API密钥

img

复制填充即可

img

设置完成,等几秒钟加载即可,点击保存

img

查看结果

使用混合检索,查询出来的结果相对精确一些,经过重排序模型排序之后,结果会以相似度排序展示。

img

img

聊天助手

​ 聊天助手是直接和用户对话的AI,通过大模型理解问题并生成回复。原理是实时调用AI模型分析上下文,用自然语言交互解决咨询、问答等需求。

输入应用名称,点击创建

img

编排

进入编排页面

​ 既然我们是聊天机器人,先设置一个开场白,点击开启,我是设置成了“欢迎来到DeepSeek的世界”

img

设置知识库为上下文

img

记得点击右上角的更新、发布,否则修改将不会生效

img

我们来问下“DeepSeek是什么”,回答就是基于知识库来的

img

可以根据知识库中的测试来验证下

img

访问API

当我们配置完成之后,可以通过API嵌入到应用中

img

API使用需要密钥,右上角创建即可

img

日志与标注

日志记录了应用的运行情况

img

概览

概览就是看下API的使用情况

img

至此,聊天助手算是基本创建完成,需要更完整的能力,就需要你来自己尝试下了。

Agent(智能体或智能代理)

​ Agent是能自动处理复杂任务的AI助手,比如查数据或操作其他软件。原理是预设规则或学习用户目标,拆解任务后调用工具(搜索、API)自主完成

输入应用名称,点击创建

img

编排

输入提示词,即你希望这个智能体帮你完成什么任务

img

选择工具,智能体就是让AI使用工具完成任务的具体存在,所以会有很多工具可选

当然,如果你懂编程,也可以自定义工具

img

img

选择完工具,点击右上角的更新发布即可完成

我们来测试下吧,我创建的是个股票分析智能体,我问了下“大前天苹果的股价情况”

思考的过程中会发现已经在使用工具,时间工具和股票分析工具

img

哎,你猜怎么着,它没回答出来,不管它了,我的电脑也就这样了,只要大概的流程说清楚就行

img

工作流

工作流是把多个AI步骤串联起来的自动化流水线,比如先分类再生成内容。原理是用可视化流程编排不同工具和模型,按顺序执行任务,像工厂流水线一样协作。

选择工作流,输入应用名称,点击创建即可

img

编排

默认进来展示开始节点和下一节点选择

img

在开始节点设置下变量,也就是我们要进行对话,工作流需要接收到我们问的内容,需要有个参数来接收

img

这里我选择段落,因为文本的字数有限,段落字数默认最大33024,命名为message

img

第二个节点选择知识检索,引入我们创建的知识库

img

知识库检索的内容将会作为输出变量输出,同时也会作为输入变量被下一节点使用

img

第三个节点选择大语言模型LLM,需要切换模型至deepseek

img

LLM中接收上一节点的输出参数,并设置提示词

img

LLM的输出参数也将作为输入参数被下一节点使用

img

最后的节点选择结束节点

选择大模型输出的变量即可

img

点击右上角的更新、发布,再点击运行

img

输入“DeepSeek是什么”,将会根据知识库信息进行返回

img

我们通过知识库中的分段信息确认下其是否使用知识库回答

img

访问API

Dify提供了对应的工作流API,可以嵌入到应用中进行使用,方法与前面介绍的聊天助手相似

img

日志及概览

日志和概览也都是对API的监控,不做过多介绍

至此,工作流也介绍完了

​ 上面的流程基本涵盖了Dify的基本功能,也包括了DeepSeek的深度使用,例子很简单,但想要真正提效,还需要结合自身业务深入实践

那么,如何系统的去学习大模型LLM?

作为一名从业五年的资深大模型算法工程师,我经常会收到一些评论和私信,我是小白,学习大模型该从哪里入手呢?我自学没有方向怎么办?这个地方我不会啊。如果你也有类似的经历,一定要继续看下去!这些问题啊,也不是三言两语啊就能讲明白的。

所以我综合了大模型的所有知识点,给大家带来一套全网最全最细的大模型零基础教程。在做这套教程之前呢,我就曾放空大脑,以一个大模型小白的角度去重新解析它,采用基础知识和实战项目相结合的教学方式,历时3个月,终于完成了这样的课程,让你真正体会到什么是每一秒都在疯狂输出知识点。

由于篇幅有限,⚡️ 朋友们如果有需要全套 《2025全新制作的大模型全套资料》,扫码获取~
在这里插入图片描述

👉大模型学习指南+路线汇总👈

我们这套大模型资料呢,会从基础篇、进阶篇和项目实战篇等三大方面来讲解。
在这里插入图片描述
在这里插入图片描述

👉①.基础篇👈

基础篇里面包括了Python快速入门、AI开发环境搭建及提示词工程,带你学习大模型核心原理、prompt使用技巧、Transformer架构和预训练、SFT、RLHF等一些基础概念,用最易懂的方式带你入门大模型。
在这里插入图片描述

👉②.进阶篇👈

接下来是进阶篇,你将掌握RAG、Agent、Langchain、大模型微调和私有化部署,学习如何构建外挂知识库并和自己的企业相结合,学习如何使用langchain框架提高开发效率和代码质量、学习如何选择合适的基座模型并进行数据集的收集预处理以及具体的模型微调等等。
在这里插入图片描述

👉③.实战篇👈

实战篇会手把手带着大家练习企业级的落地项目(已脱敏),比如RAG医疗问答系统、Agent智能电商客服系统、数字人项目实战、教育行业智能助教等等,从而帮助大家更好的应对大模型时代的挑战。
在这里插入图片描述

👉④.福利篇👈

最后呢,会给大家一个小福利,课程视频中的所有素材,有搭建AI开发环境资料包,还有学习计划表,几十上百G素材、电子书和课件等等,只要你能想到的素材,我这里几乎都有。我已经全部上传到CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费
在这里插入图片描述
相信我,这套大模型系统教程将会是全网最齐全 最易懂的小白专用课!!

### 如何在 DeepSeekDify 工作流应用中实现数据库信息的查询与展示 #### 创建知识库并集成数据库连接 为了使应用程序能够查询和展示数据库中的信息,首先需要创建一个包含适当结构的知识库。这涉及到定义数据模型以及如何从外部源获取这些数据。 对于特定于数据库的操作,可以利用 Dify 的自定义插件机制或内置的数据源支持来建立与所需数据库类型的连接[^2]。一旦建立了这种连接,则可以通过 SQL 查询或其他适配器接口提取必要的记录集,并将其纳入到工作流程当中用于后续处理。 #### 编写 Agent 来执行复杂的业务逻辑 接着是编写 Agents (智能体),它们负责自动化地完成一系列指定的任务序列。针对本案例而言,应该设计这样一个 agent: - 接收来自前端界面或者其他触发条件下的请求; - 解析输入参数以确定要检索的具体表单字段及其过滤条件; - 调用预先设定好的存储过程或者直接构造动态SQL语句来进行实际的数据读取动作; - 将获得的结果整理成易于理解的形式返回给调用方; ```python def query_database(agent_input): db_connection = establish_db_connection() # 建立数据库连接 sql_query = "SELECT * FROM table_name WHERE column LIKE '%{}%'".format(agent_input['search_term']) result_set = execute_sql(db_connection, sql_query) formatted_results = format_data(result_set) return {"data": formatted_results} ``` 上述代码片段展示了简化版的agent函数`query_database()`的工作方式[^3]。请注意,在真实环境中应当采取更加严谨的安全措施防止SQL注入攻击等问题的发生。 #### 构建用户交互界面及API端点 最后一步是要搭建友好的用户体验层——即允许最终用户提交查询指令并通过直观的方式查看输出结果。这部分通常会涉及HTML/CSS/JavaScript等前端技术栈的选择,同时也可能依赖RESTful风格的服务架构向客户端暴露可编程接口以便灵活对接各种第三方系统。 当一切准备就绪后,记得按照官方文档指示保存所做的更改并正式上线发布新特性[^1]。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值