DeepSeek|手把手教你完成AI投喂数据训练

最新推荐文章于 2025-10-26 22:25:29 发布

原创最新推荐文章于 2025-10-26 22:25:29 发布 · 6.3k 阅读

31 ·

CC 4.0 BY-SA版权

文章标签：

#人工智能 #AI大模型 #大模型技术 #deepseek #AI #大模型训练 #LLM

部署运行你感兴趣的模型镜像

在完成deepseek-r1模型的本地部署后，如何搭建自己的个人知识库，训练（投喂数据）出专属自己的AI工具呢？比如多模态学习：PDF、音频、视频；使AI更加准确的理解我们的意图，更快速完整的给出精准答案，为提供我们更懂、更人性化的服务。follow me，跟着本文下述教程步骤操作就能搞定！

分五个步骤：

一、部署nomic-embed-text嵌入式模型

此操作使用ollama就可以完成，首先，运行运行我们需要指定好具体的模型名称和大小，即上篇文章安装的本地deepseek-r1:1.5b模型；

ollama run deepseek-r1:1.5b

然后打开另一个新的CMD窗口，输入命令ollama pull nomic-embed-text回车下载nomic-embed-text嵌入式模型（后面做数据投喂会用到）

二、安装AnythingLLM

AnythingLLM是一个全栈式的 AI应用，可快速构建私有化、定制化的AI助手和知识管理工具。支持将文档、资源(如网址链接、音频、视频)或内容片段转换为个人知识库。

访问AnythingLLM官网（https://anythingllm.com/desktop）选择对应系统版本的安装包进行下载（支持Windows/Mac/Linux）

右键安装包，以管理员身份运行（A）

Windows安全中心可能会提示风险，继续选择仍要运行即可

选择【所有用户】，点击下一步。

根据自身情况，选择安装位置

此处最好不要选择C盘系统盘，我选D盘，开始安装

点击完成即可

三、工作区配置搭建

点击【开始】

下一步

跳过调查即可（选填）

创建工作区，输入你的工作区名称，此处本人填Test，下一步

成功创建工作区

工作区：用来区分构建的不同知识库。点击“+新工作区“创建知识单元（如“行业报告分析、个人笔记库“等），支持多工作区独立管理，避免知识干扰。

点击左下角【设置】，可以设置模型、界面显示语言等。

此处建议设置为中文

在人工智能提供商里面，LLM首选项界面，提供商选择Ollama，Ollama Model选择上文下载部署的DeepSeek-R1系列模型1.5b，然后点击Save changes

在Embedder首选项界面，嵌入引擎提供商选择Ollama，Ollama Embedding Mode选择【nomic-embed-text】（第一步部署的nomic-embed-text嵌入式模型），然后点击保存更改。

回到创建的工作区，点击【工作区设置】

在聊天设置界面，工作区LLM提供者选择【Ollama】，工作区聊天模型选择本地部署的【deepseek-r1:1.5b】模型，然后点击最下方【Update workspaces】

在代理配置界面，工作区代理LLM提供商选择【Ollama】，工作区代理模型仍旧选择【deepseek-r1:1.5b】，然后点击【Configure Agent Skills】。

四、投喂数据（训练AI）

在创建的工作区界面，点击【上传】按钮

分为两个区域，左侧为本地文件区，右侧为投喂区（工作区）

点击左下上传功能选择需要上传的文件（支持PDF、TXT、Word、Excel、PPT等常见文档格式），勾选出要投喂上传的文件，点击【Move to Workspace】。

待投喂文件会上传至右方区域（工作区），点击【Save and Embed】。

完成数据投喂（训练）。

五、实例验证

投喂前：

问题：询问“魅在心头公众号是干嘛的”

得出结果如下：

嗯，用户问的是“魅在心头公众号是干嘛的”。首先，我需要回顾一下之前的信息。用户提到了“魅”可能指的是一个品牌或平台的名字，比如微信、微博等等。然后，关于公众号，通常包括运营、内容生产、市场营销等方面。接下来，我要考虑不同的情况。如果用户指的是微信公众号，那么常见的功能有广告投放、内容创作、推广活动等。如果是微博，可能会有更多的话题讨论和互动。还有其他可能的公众号类型，比如社交媒体平台的内容管理或企业内部的信息发布。然后，我需要确认这些信息是否全面。比如，除了上述功能，有没有其他的方面？或者用户可能对具体的功能还不太清楚，这时候可以建议他们关注公众号的官方文档或使用工具来了解更多信息。最后，综合以上分析，我要回答用户的问题，并引导他们查看相关的资料以获取更详细的信息。关于“魅在心头公众号”的具体功能和用途，需要根据具体的公众号类型和运营情况来理解。如果你指的是某个特定的公众号或品牌（如“魅”可能指的不是微信公众号，而是其他类型的公众号），那么它的功能可能会有所不同。如果是像微信这样的社交媒体平台，其公众号通常会提供以下内容： 1. 内容创作：发布用户生成的文字、图片、视频等。2. 广告投放：通过合作或者手动投放广告信息。3. 话题讨论：参与话题讨论和互动。4. 推广活动：通过合作或单独推广活动吸引目标 audience。如果你指的是其他类型的公众号，例如微博或企业内部的平台，功能可能会有所不同。需要提供更多上下文信息才能更准确地回答你的问题。如果你有具体的公众号类型或其他细节，可以进一步说明，我可以提供更详细的解答。

投喂数据：

投喂后：

得出训练后结果如下：

嗯，用户现在问的是“魅在心头公众号是干嘛的”。看起来他们之前已经讨论过“魅”可能是一个品牌或平台的名字，但这次具体涉及到公众号的内容。首先，我需要确认“魅在心头”具体指的是什么类型的公众号。可能是微信公众号、微博公众号或者其他类型的社交媒体平台。如果没有明确的信息，我需要做一些合理的推测。假设“魅”是一个品牌或平台的缩写，那么“魅在心头”可能是指某个具体的公众号名称。例如，μ在initials中，可能指的是一种独特的或者创新的公众号类型。接下来，我要考虑公众号的功能和用途。通常，公众号的主要功能包括内容发布、广告投放、互动交流等。如果用户问的是公众号本身的功能，我可以总结一些常见的特点： 1. 内容创作：发布用户生成的文字、图片、视频等。2. 广告投放：通过合作或手动投放广告信息。3. 话题讨论：参与话题讨论和互动。4. 推广活动：通过合作或单独推广活动吸引目标 audience。如果没有具体的公众号信息，我需要假设“魅在心头”可能是一个新兴的公众号类型，或者是一个专注于特定领域的内容平台。因此，我可能会建议用户查看该公众号的官方文档、使用公众号工具了解更多信息。最后，我要确保回答准确，并引导用户关注相关的资料或工具来深入了解公众号的具体功能和用途。 “魅在心头”的公众号名称并未明确说明具体的功能内容，但可以推测其可能是一个专注于某一领域的个人微信公众号或社交媒体平台。以下是一些可能的解释： 1. 内容创作：发布与“魅”相关的内容，**涵盖个人爱好、人生感悟、生活杂谈等。**2. 广告投放：通过合作或手动投放广告信息。3. 互动交流：参与公众号内的话题讨论和互动活动。如果你需要更详细的信息，可以参考该公众号的官方文档或使用相关工具（如微信公众号管理界面）来获取更多信息。

可以看出，投喂数据（训练）后给出的答案（画线加粗处）与投喂的数据相吻合，说明AI经过了投喂数据的训练；投喂后能够根据投喂的数据资料完成消化学习，并准确分析给出解答方案。