Dify 实操保姆级教程：零代码打造 AI 搜索引擎

最新推荐文章于 2025-04-09 18:35:17 发布

大语言模型

最新推荐文章于 2025-04-09 18:35:17 发布

阅读量1.2w

点赞数 31

文章标签：人工智能搜索引擎大模型 LLM MaxKB 知识库 Dify

本文链接：https://blog.csdn.net/2301_81940605/article/details/143730438

版权

最近各大厂商都在搞智能体平台，前有字节的 Coze，后有腾讯的元器、支付宝的百宝箱。

之前免费出圈的 Coze 从 8 月开始收费之后，很多小伙伴们在问有没有好用的开源平替？

就笔者目前的体验而言：Dify / FastGPT / MaxKB 三者，从部署和使用角度来看，对小白还算友好。

若问三者怎么选？

FastGPT：在知识库召回上更优；
Dify：插件生态更完善。
MaxKB：界面最简洁，内存占用高。

如果都没用过，那么首推 Dify。

MindSearch 默认采用 DuckDuckGo 搜索引擎，导致后端服务经常出问题，用户体验非常不好。

最近在琢磨有没有更好的平替方案：何不用 Dify 自己搭一个？

今日分享，带大家实操：如何用 Dify 搭建一个 AI 搜索引擎。

1. 为什么是 Dify

在线体验：https://dify.ai/
开源地址：https://github.com/langgenius/dify
官方文档：https://docs.dify.ai/v/zh-hans

Dify 应该算是智能体平台的鼻祖，在 ChatGPT 推出后不久就已问世。

只不过 Coze 后来居上，在用户体验上，对小白更加友好。

但从关键技术栈上来看，二者非常类似。

如果你用过 Coze 搭建智能体，那么迁移到 Dify 会非常丝滑。

如果不想本地部署，上面的体验地址也提供了一定的免费额度，知识库支持上传 50 个文档，RAG 向量空间只有 5 MB。

2. Dify 本地部署

如果不想付费，且对数据安全有要求，那么强烈建议你本地部署，参考下方教程，相信你也能搞定,

推荐采用 Docker compose 傻瓜式安装。

有一点需要注意，所有环境变量都在 .env 中配置，Dify 默认采用 Nginx 把 web 界面映射到了 80 端口，如果 80 端口已被占用，需修改EXPOSE_NGINX_PORT变量，比如：

EXPOSE_NGINX_PORT=3006

启动成功后，你应该看到有 9 个容器：

 ✔ Network docker_ssrf_proxy_network  Created
 ✔ Network docker_default             Created
 ✔ Container docker-weaviate-1        Started
 ✔ Container docker-web-1             Started
 ✔ Container docker-sandbox-1         Started
 ✔ Container docker-redis-1           Started
 ✔ Container docker-ssrf_proxy-1      Started
 ✔ Container docker-db-1              Started
 ✔ Container docker-worker-1          Started
 ✔ Container docker-api-1             Started
 ✔ Container docker-nginx-1           Started

接下来，我们一起搞定AI 搜索引擎的智能体搭建！

注：无论在线体验，还是本地部署，下面的实操没任何区别。

3. AI 搜索引擎搭建

3.1 接入大模型

参考本地部署 AI 智能体，Dify 搭建保姆级教程，接入你能用上的各种大模型。

比如，我常用的有：

在这里插入图片描述

其中：Ollama 用来接入本地部署的大模型；OpenAI-API-compatible 则用来接入 OneAPI 代理的各种大模型。

大模型接入后，就可以着手智能体搭建了。

3.2 创建应用

参考下图，注意选择工作流编排：

在这里插入图片描述

二者有什么区别？

基础编排：只支持知识库接入，和角色提示词的设定，适合简单应用搭建；
工作流编排：支持各种外部插件的接入，可定制化程度非常高。

3.3 编辑应用

进来后，默认的初始化页面如下图，一个非常干净的聊天助手，啥附加功能也没有，本文就以加入搜索功能为例，带大家体验下，给智能体装上三头六臂的效果。

在这里插入图片描述

最终实现如下：

在这里插入图片描述

你会发现，其实就比上图多了一个模块：TavilySearch。

TavilySearch 就是 Dify 内置的一个搜索插件。

当然，Dify 内置的搜索插件还有很多，考虑到很多朋友在国内无法访问，TavilySearch是笔者亲测对小白比较友好的一个。

怎么添加？

看下图：

在这里插入图片描述

当然你也可以选择其他搜索插件，基本都有免费额度，去点点看！

添加之后，TavilySearch 的输入是啥呢？

点击 TavilySearch 模块，在这里：

在这里插入图片描述

它代表开始模块的sys.query参数，其他模块也大同小异，聪明如你，多点点就熟悉了！

最后，来看下 LLM 模块，System 中填入角色提示词：根据搜索引擎检索到的内容：{{text}}，回答用户的提问。

在这里插入图片描述

Dify 默认支持 10 轮对话的记忆，在下方可以手动设置。

3.4 测试应用

把所有模块连接好后，点击右上角预览，测试一下：

在这里插入图片描述

如果没什么问题，点击右侧发布。

至此，一个简单的 AI 搜索引擎 宣告搭建完毕！

4. API 接入小爱

如果希望将 AI 搜索引擎 内嵌到应用中，自然还少不了后端的 API。

左侧菜单栏，找到访问 API，点击获取 API 密钥：

在这里插入图片描述

注意：API 基础 URL 是不变的，Dify 用来区分不同智能体的是API 密钥

来写个请求看看：

import requests

url = 'http://10.18.xxx.xxx:3006/v1/chat-messages'
api_key = 'app-xxx'  

headers = {
    'Authorization': f'Bearer {api_key}',
    'Content-Type': 'application/json',
}

data = {
    "inputs": {},
    "query": "今日AI热点",
    "response_mode": "blocking",
    "conversation_id": "",
    "user": "xiaoai",
}

response = requests.post(url, headers=headers, json=data)
print(response.json())

几个关键参数说明：

user: 用于定义终端用户的身份，方便检索、统计，必填;
conversation_id：如果需要基于之前的聊天记录继续对话，必须传入；
response_mode：为 blocking 时，全部生成后再返回，为streaming时，流式输出。

输出结果如下：

{'event': 'message', 'task_id': '98524256-40ad-471b-9481-57b2ba8f564d', 'id': '45811855-6ce8-4788-8e3d-ff307f5663a6', 'message_id': '45811855-6ce8-4788-8e3d-ff307f5663a6', 'conversation_id': 'da72fe30-795b-4259-a114-193b6ed0828d', 'mode': 'advanced-chat', 'answer': '以下是今日一些值得关注的AI热点新闻：\n\n1. **Microsoft退出OpenAI董事会**：迫于监管压力，微软和苹果放弃了在OpenAI董事会中担任职务的计划。此举引发了广泛关注，凸显出大型科技公司对人工智能的影响力正日益成为监管机构的焦点。\n\n2. **稳定音频重磅更新**：Stability AI为用户友好的AI创作工具Stable Assistant推出了重磅更新，包括备受期待的Stable Audio音乐生成功能和“搜索和替换”图像编辑功能，为用户带来更强大的图像和音频生成体验。', 'metadata': {'usage': {'prompt_tokens': 18657, 'prompt_unit_price': '0', 'prompt_price_unit': '0.000001', 'prompt_price': '0E-7', 'completion_tokens': 1385, 'completion_unit_price': '0', 'completion_price_unit': '0.000001', 'completion_price': '0E-7', 'total_tokens': 20042, 'total_price': '0E-7', 'currency': 'RMB', 'latency': 7.6047362219542265}}, 'created_at': 1730093219}

请求成功后，在客户端可以查看日志：

在这里插入图片描述

最后，我们只需把微信 AI 机器人的后端接口，改为 Dify 的接口，就 OK 了。

实测效果如下：

在这里插入图片描述

写在最后

本文通过一个简单案例，带大家实操了Dify 搭建 AI 搜索引擎，整体流程比较简单，相信看到这里的你，一定还有很多想法要实现，快去试试吧~

如何系统的去学习大模型LLM ？

大模型时代，火爆出圈的LLM大模型让程序员们开始重新评估自己的本领。 “AI会取代那些行业？”“谁的饭碗又将不保了？”等问题热议不断。

事实上，抢你饭碗的不是AI，而是会利用AI的人。

继科大讯飞、阿里、华为等巨头公司发布AI产品后，很多中小企业也陆续进场！超高年薪，挖掘AI大模型人才！ 如今大厂老板们，也更倾向于会AI的人，普通程序员，还有应对的机会吗？

与其焦虑……

不如成为「掌握AI工具的技术人」，毕竟AI时代，谁先尝试，谁就能占得先机！

但是LLM相关的内容很多，现在网上的老课程老教材关于LLM又太少。所以现在小白入门就只能靠自学，学习成本和门槛很高。

针对所有自学遇到困难的同学们，我帮大家系统梳理大模型学习脉络，将这份 LLM大模型资料 分享出来：包括LLM大模型书籍、640套大模型行业报告、LLM大模型学习视频、LLM大模型学习路线、开源大模型学习教程等, 😝有需要的小伙伴，可以 扫描下方二维码领取🆓↓↓↓

👉CSDN大礼包🎁：全网最全《LLM大模型入门+进阶学习资源包》免费分享（安全链接，放心点击）👈

一、LLM大模型经典书籍

AI大模型已经成为了当今科技领域的一大热点，那以下这些大模型书籍就是非常不错的学习资源。

在这里插入图片描述

二、640套LLM大模型报告合集

这套包含640份报告的合集，涵盖了大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师，还是对AI大模型感兴趣的爱好者，这套报告合集都将为您提供宝贵的信息和启示。(几乎涵盖所有行业)

在这里插入图片描述

三、LLM大模型系列视频教程

在这里插入图片描述

四、LLM大模型开源教程（LLaLA/Meta/chatglm/chatgpt）

在这里插入图片描述

LLM大模型学习路线 ↓

阶段1：AI大模型时代的基础理解

目标：了解AI大模型的基本概念、发展历程和核心原理。
内容：
- L1.1 人工智能简述与大模型起源
- L1.2 大模型与通用人工智能
- L1.3 GPT模型的发展历程
- L1.4 模型工程
- L1.4.1 知识大模型
- L1.4.2 生产大模型
- L1.4.3 模型工程方法论
- L1.4.4 模型工程实践
- L1.5 GPT应用案例

阶段2：AI大模型API应用开发工程

目标：掌握AI大模型API的使用和开发，以及相关的编程技能。
内容：
- L2.1 API接口
- L2.1.1 OpenAI API接口
- L2.1.2 Python接口接入
- L2.1.3 BOT工具类框架
- L2.1.4 代码示例
- L2.2 Prompt框架
- L2.3 流水线工程
- L2.4 总结与展望