官方技术文档查询大模型:快速搭建与实践记录

背景介绍

在过去使用大模型的过程中,感受到大模型能力的持续提升。但是作为程序员,在基于不熟悉的框架开发新功能时,依旧需要持续查询官方文档。而大模型对特定框架的使用细节所知甚少,因此可能给出的回答不够准确。

比如之前在 快速搭建量化交易平台 时因为不熟悉相关框架就需要反复查看 Dashbacktrader 的官方文档寻找解决方案,这部分工作需要花费不少时间。

事实上单个项目的技术框架选型完成后就会稳定下来,因此是否可以直接基于框架的官方文档进行知识库问答。这样就可以避免重复的查询文档,节省时间。

这个问题初步评估应该是比较容易解决的,至少 RAG 看起来应该就是现成的解决方案。

本周周末,花费了 10 个番茄钟,快速搭建了一个官方文档查询的大模型应用,本篇文档记录下完整的实践过程,希望对大家有所帮助。

需求分析

简单梳理了一下需求,这个需求主要是利用采集的官方文档作为外部信息源,弥补大模型知识不足的问题。期望可以实现一个可视化的服务,接收到用户的查询时,结合官方文档给出更准确的答案。

简单分解下需求的实现流程:

  1. 实现文档爬取功能,基于提供的官方文档入口地址,爬取框架下所有官方技术文档;
  2. 支持根据官方文档搭建知识库;
  3. 接入大模型,执行完整的问答;

实践流程

因为期望能用最小的成本验证这个需求,所以期望尽可能基于现有的基础服务实现。

Dify 尝试

从之前调研的情况来看,Dify 应该是一个不错的选择,本身自带知识库构建的能力,也可以接入大量的外部拓展。

在 Dify 上构建知识库时发现,Dify 本身就提供了直接 Sync From Website 的能力,看起来真的可以一步到位的样子。

Dify 同步网站内容是基于 Firecrawl 实现的。但是实际测试 Dify 绑定 Firecrawl 会报错 500 异常:

请添加图片描述

反复尝试都是够不成功,看起来 Dify 这部分功能应该还有问题。

Firecrawl 尝试

Dify 支持不了,看起来知识库构建需要自己动手。考虑先离线爬取,之后再上传至 Dify 构建知识库。

简单看了下 Firecrawl 的官方文档,实现了一个快速的版本:

from firecrawl import FirecrawlApp

# 需要注册网站获取 API_KEY

API_KEY = ""

app = FirecrawlApp(api_key=API_KEY)
# 爬取目标网站,目前爬取的就是 Dify 的官方文档

url = "https://docs.dify.ai/v/zh-hans"

crawl_result =
### Dify 安装包下载指南 目前关于 Dify 的具体安装方法并未在提供的引用中提及。然而,可以推测其可能涉及类似于 Python 或 Docker 的环境配置过程[^1]。以下是基于常见实践的建议: #### 方法一:通过官方文档获取安装包 通常情况下,软件项目的官方网站会提供详细的安装指导以及对应的安装包链接。对于 Dify 来说,访问其官网或者 GitHub 页面可能是最直接的方式。 ```bash # 假设 Dify 提供了 pip 安装支持,则可以通过如下命令完成安装: pip install dify ``` 如果需要特定版本的支持,可尝试指定版本号进行安装[^2]: ```bash pip install dify==<version> ``` #### 方法二:利用 Docker 部署 部分项目为了简化部署流程,推荐使用 Docker 方式运行应用。这引用中的 Docker Engine 安装步骤相似[^3]: 1. **更新并安装必要的组件** ```bash sudo apt-get update sudo apt-get install docker-ce docker-ce-cli containerd.io docker-compose-plugin ``` 2. **拉取 Dify 的镜像文件** 如果存在公开可用的镜像资源,可通过以下命令实现快速部署: ```bash docker pull <repository>/dify:<tag> ``` 3. **启动容器服务** 使用 `docker run` 启动已准备好的镜像实例: ```bash docker run -d --name dify-container -p 8080:8080 <repository>/dify:<tag> ``` #### 方法三:解决潜在错误提示 当遇到类似无法连接到目标应用程序的情况时,需确认后台服务是否正常开启[^4]。针对 Ollama 应用程序而言,执行以下操作即可解决问题: ```bash sudo ollama serve ``` 同理,在处理 Dify 及其他依赖项的过程中也应遵循此逻辑——即确保所有前置条件均已满足后再继续后续环节的操作。 ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

易迟

高质量内容创作不易,支持下

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值