AnythingLLM + Ollama 实现私有知识库

最新推荐文章于 2025-03-18 17:04:34 发布

小天才学习机打游戏

最新推荐文章于 2025-03-18 17:04:34 发布

阅读量6.9k

点赞数 25

文章标签：人工智能知识图谱神经网络 langchain windows

本文链接：https://blog.csdn.net/m0_59164520/article/details/145400606

版权

前言

本文将介绍如何通过 AnythingLLM 与 Ollama 结合，搭建一个具备私有知识库能力的 AI 应用。

AnythingLLM 简介

AnythingLLM 是一款开箱即用的一体化 AI 应用，支持 RAG（检索增强生成）、AI 代理等功能。它无需编写代码或处理复杂的基础设施问题，适合快速搭建私有知识库和智能问答系统。

主要特性：

多种部署方式：支持云端、本地和自托管部署。
多用户协作：支持团队协作，适用于企业知识管理和客户支持。
多模型支持：兼容 OpenAI、Anthropic、LocalAI 等主流大模型。
多向量数据库支持：支持 Pinecone、Weaviate 等向量数据库。
多文件格式处理：支持 PDF、TXT、DOCX 等文件格式。
实时网络搜索：结合 LLM 响应缓存与对话标记功能，提供高效的文档管理和智能问答能力。

下载与安装

AnythingLLM 提供了 Mac、Windows 和 Linux 的安装包，用户可以直接从官网下载并安装。

安装完成后，首次启动时会提示配置偏好设置。用户可以根据需求进行设置，后续也可以随时修改。

配置 LLM 提供商

在 AnythingLLM 的设置页面，可以通过 LLM 首选项 修改 LLM 提供商。本文使用本地部署的 Ollama 和 qwen2.5:14b 模型。配置完成后，务必点击 Save changes 按钮保存设置。

❝

注意：关于 Ollama 的部署与使用，请参考之前的教程。

上传文档

在聊天界面中，用户可以创建多个工作区。每个工作区可以独立管理文档和 LLM 设置，并支持多个会话（Thread），每个会话的上下文也是独立的。

点击上传图标，可以管理当前工作区的知识库。AnythingLLM 支持以下三种方式上传文档：

本地文档上传：直接上传本地文件。
Web 链接：通过 URL 上传网页内容。
数据链接：从 GitHub、GitLab 等平台导入数据。

Documents 界面

在 Documents 界面，用户可以管理已上传的文档，并通过下方的上传按钮或拖拽方式上传新文档。

❝

提示：如果需要上传整个目录及其子目录中的文档，直接将目录拖拽到上传按钮上即可。

Data Connectors

Data Connectors 功能支持从 GitHub、GitLab 仓库或网站爬取数据。用户只需输入仓库地址和 Token，即可导入指定目录或网页内容。

上传示例

以下是一个从 GitHub 仓库导入数据的示例：

输入仓库地址和 Token。
通用 File Ignores 配置导入的目录。
点击导入按钮，等待数据加载完成。

导入完成后，用户可以在 Documents 界面选中文档，并点击 Move to Workspace 将其添加到工作区。

添加到工作区后，点击 Save and Embed，将文档内容转换为向量检索所需的嵌入数据结构。此过程可能会消耗较多 CPU 资源，具体时间取决于文档数量。

查询知识库

将文档添加到工作区后，用户可以通过设置聊天模式调整大模型的回复方式：

聊天模式：结合 LLM 的通用知识和上传文档的上下文生成答案。
查询模式：仅基于上传文档的上下文生成答案。

在聊天窗口中，用户可以直接提问。大模型会基于文档内容生成答案，并标注答案来源。

使用 Agent 能力

AnythingLLM 支持 AI 代理功能，用户可以通过 Agent 完成特定任务。除了官方提供的默认 Agent（如 Scrape websites），还支持通过社区添加自定义 Agent。

配置 Agent

在设置页面的 代理技能 中，用户可以管理 Agent。默认开启的 Agent 无法关闭，其他 Agent 需要手动启用。

使用示例

以下是一个使用 Scrape websites Agent 的示例：

在聊天界面输入 @agent + 提示词，启动 Agent 会话。

Agent 会通过 Web Scraping 工具爬取指定页面并返回结果。

❝

注意：启动 Agent 会话后，无需每次输入 @agent。退出 Agent 会话可通过切换聊天页面或输入 /exit 命令。

当会话提示 Agent session complete 时，表示已退出 Agent 会话。

结语

通过 AnythingLLM 和 Ollama 的结合，我们成功搭建了一个具备私有知识库能力的 AI 应用。私有知识库不仅可以让 AI 回答通用问题，还能基于私有文档（如企业内部资料、图书等）生成更精准的答案。

❝

注意：随着知识库中文档数量的增加，回答的准确性可能会受到影响。建议将文档分散到多个工作区，以提高检索效率。

如何学习大模型 AI ？

由于新岗位的生产效率，要优于被取代岗位的生产效率，所以实际上整个社会的生产效率是提升的。

但是具体到个人，只能说是：

“最先掌握AI的人，将会比较晚掌握AI的人有竞争优势”。

这句话，放在计算机、互联网、移动互联网的开局时期，都是一样的道理。

我在一线互联网企业工作十余年里，指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑，所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

在这里插入图片描述