引言
在信息爆炸的时代,知识的积累与管理变得愈发重要。个人知识库就像是我们的知识宝库,能帮助我们有效地整理、存储和快速检索各种重要信息。无论是工作中的专业知识、学习过程中的资料,还是生活里的各类经验,都能在个人知识库中找到合适的位置。它不仅能提高我们的工作和学习效率,还能助力我们进行知识的深度挖掘与创新。
今天,我将为大家详细介绍如何利用 CherryStudio、硅基流动与DeepSeek 来搭建一个属于自己的强大个人知识库。

这里可能有人想,既然都有了DeepSeek的App,为什么还要自己搭建。原因想必大家都知道。因为它太火爆了!总是出现‘‘服务器繁忙,请稍后再试’’的提示。所以动手能力强的可以自己试试搭建一个。还要说明一点,这次的操作跟电脑配置好坏关系不大,可放心操作。
一、认识搭建工具
1.CherryStudio

CherryStudio是一个支持多平台的AI客户端,致力于让更多人能够享受到AI带来的便利,内置 30 多个行业的智能助手,300 + 预配置 AI 助手,帮助用户在多种场景下提升工作效率。兼容 Windows、Mac ,未来还会支持移动平台,真正实现了跨平台使用 。在文档与数据处理方面,它支持 PDF、DOCX、PPTX、XLSX、TXT、MD 等多种文件格式,还具备 WebDAV 文件管理与数据备份功能。个别模型还支持联网。

2.硅基流动 SiliconFlow

SiliconCloud是一站式大模型云服务平台,其目标是通过优化大模型使用体验,帮助用户实现 “Token 自由”,让你能以更低成本和更高效率使用先进的大语言模型(LLMs)及其他生成式人工智能(AI)模型。平台集成了多种主流开源大模型,从文本生成模型如 DeepSeek R1、Qwen2.5、GLM-4,到图片生成模型如 Janus-Pro、Stable-Diffusion(SDXL)等一应俱全 。它还支持多模态模型,无论是文本生成语音、文本生成图像还是文本生成视频,都能轻松实现。而且,硅基流动提供行业内较低的 API 调用价格,对于 9B 及以下的模型,还提供免费 API 服务,对个人开发者及小型项目十分友好。同时,平台内置推理加速引擎,能显著提升模型的响应速度及生成效率,还支持大模型的微调与托管,方便用户根据自定义数据优化模型性能。
3.DeepSeek

DeepSeek 是一家中国人工智能公司,成立于 2023 年 7 月,总部位于杭州。 由量化投资公司幻方量化创始人梁文锋领导,DeepSeek 致力于开发高效且高性能的生成式 AI 模型。
自成立以来,DeepSeek 发布了多个引人注目的开源模型,包括:
DeepSeek Coder:专注于代码生成和调试。
DeepSeek LLM:通用大语言模型,支持多种自然语言处理任务。
DeepSeek-V2:采用混合专家(MoE)架构,参数量达到 2360 亿,推理成本显著降低。
DeepSeek-V3:参数量达到 6710 亿,采用创新的 MoE 架构和 FP8 混合精度训练,训练成本仅为 557.6 万美元。
DeepSeek-R1:新一代推理模型,性能与 OpenAI 的 o1 正式版相当,并已开源。
当 Cherry-Studio 遇上硅基流动和 DeepSeek,又会碰撞出怎样的火花呢?下文中,我们将深入探讨它们的组合应用。
二、搭建前的准备工作
文字说明下面有图片说明
1.硅基流动平台注册
首先,打开浏览器,访问硅基流动官网硅基流动统一登录,目前官方有活动,注册输入我的邀请码 lCIBYejZ 或者直接点链接 硅基流动统一登录 ,即可获得 2000 万 Tokens 。

在官网首页点击 “Log in” 按钮,进入登录页面 。按照页面提示,填写有效的手机号码、设置密码,并填写其他必要信息(如邀请码 lCIBYejZ ) 。完成信息填写后,点击 “获取验证码” 按钮,手机将收到一条包含验证码的短信,在指定位置输入验证码,验证手机号码真实性 。仔细阅读并勾选同意硅基流动的用户协议和隐私政策,最后点击 “注册/登录” 按钮完成注册流程 。
2.创建 API 密钥
创建 API 密钥:注册成功并登录硅基流动平台后,在页面左侧选择 “API 密钥” 选项 (或点击链接 SiliconCloud)。进入 API 密钥管理页面,点击 “新建 API 密钥” 按钮 。系统会弹出确认对话框,填写密钥描述,确认创建后,系统将生成一个唯一的 API 密钥 。复制这个密钥,将其粘贴到一个安全的文本文件中保存,这是后续配置的重要凭证 。
3.下载安装 CherryStudio
访问 Cherry-Studio 官方网站Cherry Studio - 全能的AI助手,在网站首页找到 “下载客户端” 按钮。下载过程可能有点慢,完成后,找到安装包文件并双击运行,在安装向导中,按照提示逐步完成安装过程 。在 Windows 系统下,可能需要点击 “下一步”、选择安装路径、接受许可协议等步骤 。
三、搭建个人知识库详细步骤
1.配置 API 密钥
安装完成后,打开 Cherry Studio 应用程序,在应用程序界面的左下角找到并点击 “设置” 图标,进入设置页面 。在设置页面中,找到 “模型服务” 选项卡,点击展开 。在模型服务列表中找到 “硅基流动”,将之前复制的 API 密钥粘贴到相应位置,点击保存 。
2.添加DeepSeek模型
在 Cherry Studio “硅基流动” 的设置中,点击 “管理”按钮,在弹出的窗口中,选择全部Tab,然后搜索 “DeepSeek-V3” 671B(或其他你需要的 DeepSeek 模型),找到后点击 “+” 。添加完成后,点击右边的 “检查” 按钮,若显示 “✔连接成功”,则表示配置成功 。
3.添加“BAAI/bge-m3嵌入模型”
在 Cherry Studio “硅基流动” 的设置中,点击 “管理”按钮,在弹出的窗口中,选择嵌入Tab,然后搜索 “BAAI/bge-m3”,找到后点击 “+” 。
BAAI/bge-m3 模型是一个能帮你更智能地检索和理解你知识库中内容的工具。将您的知识库中的文本转换为高质量的向量表示,它的作用有点像是给你的知识库“加了一双慧眼”,让它能更准确地找到你需要的信息。
4.验证测试
点击 Cherry Studio 左侧菜单栏的 “对话” 按钮,在输入框内输入文字,即可开始与 DeepSeek 模型进行对话 。此时,你可以选择顶部菜单中的模型名字,确保选择的是刚刚添加的 DeepSeek 模型,测试是否能够正常交互 。


通过以上步骤,你就可以在 Cherry Studio 中通过硅基流动轻松配置 DeepSeek,享受高效、稳定的 AI 服务了 。
5.配置个人专属知识库
我觉得这个知识库的好处除了可以让大模型回答问题,还有就是通过‘‘搜索知识库’’的功能,可以让你基于文档中的内容来进行搜索。现在好多工具,比如everything,也就只能根据文件的名称搜索。
- 打开知识库界面:
- 左侧菜单栏中选择“知识库”选项。
- 添加知识库:
- 在知识库界面,点击左上角的“添加”按钮。
- 在弹出的窗口中,填写以下信息:
- 名称:输入知识库的名称。
- 嵌入模型:选择或输入嵌入模型。
- 点击“确定”按钮完成添加。
- 添加文件:
- 在知识库界面,点击“文件”选项卡。
- 点击右上角的“添加文件”按钮。
- 在弹出的窗口中,选择要添加的文件(支持pdf、docx、pptx、xlsx、txt、md格式)。
- 点击“确定”按钮完成文件上传。
- 查看文件内容:
- 在文件选项卡中,点击已上传的文件(例如:测试知识库.txt)。
- 在弹出的窗口中,可以查看文件的详细内容。
- 测试文件:
- 在知识库界面,点击“搜索知识库”选项卡。
- 在搜索框中输入要搜索的内容(例如:CausalLM)。
- 点击搜索按钮进行搜索。
上面步骤,由月之暗面出品的AI-KIMI视觉版根据图片总结。真的不要太方便了!!!
上图片教程

如果有疑问,也可以去官网找找 项目简介 | CherryStudio
四、疑惑解答
1.数据隐私
这套构建知识库的方案,其缺陷仍在于数据隐私方面的问题,毕竟是调用大模型的 API 来回答问题。倘若真的对此特别介意,那么只能选择本地搭建。就本地搭建而言,我这边也尝试了 deepseek r1 的蒸馏版,7b、8b、14b ,效果着实不佳,速度极为缓慢,毕竟个人电脑的配置也就那样了。有 Q 的可以尝试一下。
2.成本问题
还能接受吧~
当下官方正在开展活动,注册时输入我的邀请码 lCIBYejZ,或直接点击链接硅基流动统一登录,便能获取 2000 万 Tokens 。



3.联网能力
目前deepseek的还不支持
发现有一个可以,大家可以尝试:
4.搭建知识库的其他方案
我自己尝试了ollama+anythingllm,ollama+chatbox,给我的感受还是目前这种方案好用。
anythingllm可以添加知识库,chatbox好像只能在对话框添加。
anythingllm chatbox 我都是使用的本地模型。
anythingllm回答的慢,chatbox回答的快。
跟电脑配置有关系,我的配置:
Windows 11 专业工作站版 64-bit
Intel(R) Core(TM) i7-10750H CPU @ 2.60GHz (12 CPUs), ~2.6GHz
内存16G
NVIDIA GeForce RTX 2060 6G
5.知识库预料
在导入数据之前,需要对数据进行一些简单的预处理。对于文本文件,如果存在乱码问题,需要先进行编码转换,确保文本内容能够正确识别。例如,使用文本编辑工具将文件编码从 GBK 转换为 UTF-8。对于办公文档和 PDF 文件,若文件中包含大量无关的图片、图表或空白页,可根据实际情况进行适当的删减,以减少数据量,提高后续处理和检索的效率 。同时,对于较长的文档,可以进行适当的分段处理,以便更好地提取文本特征和进行向量表示。
好了今天的分享就到这里了,如果对你有帮助,希望大家点点赞,多互动,有问题的也可以关注我私信我。