DeepSeek-R1深度思考推理模型+AI问答私有化部署+一站式AIGC系统+详细搭建部署教程

目录

一、人工智能

系统介绍文档

二、功能模块介绍

系统快速体验

三、系统功能模块

3.1 AI全模型支持/插件系统

AI大模型

多模态模型文档分析

多模态识图理解能力

联网搜索回复总结

3.2 AI智能体应用

3.2.1 AI智能体/GPTs商店

3.2.2 AI智能体/GPTs工作台

3.2.3 自定义创建AI智能体应用

3.3 AI专业绘画

3.3.1 文生图/图生图/参考图生图

3.3.2 局部编辑重绘

3.3.3 混图生图

3.3.4 AI换脸

3.4 AI视频生成

3.5 Dall-E2/E3绘画

3.6 智能思维导图生成

3.7 AI绘画广场

3.8 登录模块系统

3.9 H5移动端(部分)

3.10 管理后台(部分)

四、部署教程(Node.js + PM2 部署)

第一步 4.1 环境安装

第二步 4.2 Node版本选择

第三步 4.3 安装pnpm模块

第四步 4.4 安装Redis

第五步 4.5 部署跑起来

4.5.1 新建站点

4.5.2 配置SSL证书

4.5.3 上传SparkAi系统源码

4.5.4 配置.env文件

4.5.5 启动项目

4.5.5.1 开启端口

4.5.5.2 安装依赖

4.5.5.3 查看启动日志

4.5.6 添加反向代理

4.5.7 搭建完成

第六步 5.6 授权激活系统

4.6.1 未授权激活

5.6.2 激活成功示例

5.6.3 访问用户前端


一、人工智能

SparkAi创作系统是一款基于OpenAI/ChatGPT、AI大模型、AI智能体(自定义GPTs智能体对接)、AI绘画Midjourney、Dalle绘画开发的AI大模型智能问答和AI绘画系统;支持最新DeepSeek思考推理大模型(独家全天稳定高并发高可用),最新gpt-4o高级画图功能模型(中文文字画图大模型支持),支持deepseek-r1-671B满血版,最新deepseek-v3大模型,OpenAI-o1、o3推理大模型使用;claude-3-7大模型。一站式AI系统,提供面向个人用户 (ToC)、开发者 (ToD) 和企业 (ToB) 的全面解决方案。
截止2025年4月系统已经不断开发更新迭代快两年之久。系统集成了AI大模型问答、AI绘画(支持Midjourney发布最新AI图片生成模型MJ V7)、专业级AI视频生成、文档上传分析、多模态模型图像理解、TTS & 语音识别对话、文生图图生图,垫图参考图生成、图像混合(混图生图)、AI换脸、局部编辑重绘等强大功能。支持AI智能体应用(支持GPTs应用+Prompt预设自定义应用)、支持用户创建自定义AI智能体、插件系统、AI音乐生成、AIGC一站式AI系统。系统兼容OpenAI-GPT全模型、DeepSeek大模型及国内和主流三方所有AI模型,具备GPT4.0大模型支持、自定义应用、DALL-3文本生成图像、联网搜提问、智能思维导图生成、会员套餐、分销系统以及Midjourney绘画动态全功能等,为用户带来丰富的智能创作和互动体验。

系统介绍文档

《SparkAI系统介绍文档 - 渐进式AIGC系统》

二、功能模块介绍

  1. 服务端渲染技术:使用 Nodejs + NestJs 服务端渲染技术, 支持高并发(万级甚至千万级用户同时请求使用);提供更高的可用性和稳定性。

  2. 系统平台支持:支持 电脑PC端+手机端H5+微信公众号对接(支持H5打包其他平台支持)。

  3. 部署运行:支持宝塔常规部署和Decker一键部署方式,所有对接配置均可在后台界面上完成。

  4. 多模式场景公益学习/商业运营/学员工具/企业内部/内部机构 等多模式场景;支持弹性计费和各种计划模式,等等其他核心功能。

  5. 一站式AIGC系统:系统集成了AI大模型问答、AI绘画、专业级AI视频生成、文档上传分析、多模态模型图像理解、AI智能体、TTS & 语音识别对话、文生图图生图,垫图参考图生成、图像混合(混图生图)、AI换脸、局部编辑重绘等强大功能。

  6. 全模型支持:支持OpenAI官方API + 一切chat格式中转系统自定义模型对接使用(即支持OpenAI全模型、三方大模型、国内全模型);支持 OpenAI / DeepSeek大模型 / gpt-4.5大模型 / Azure OpenAI / Anthropic Claude / Google Gemini / Midjourney / 豆包 / 讯飞星火 / 百川 AI / Moonshot / 智谱 ChatGLM / 通义千问 / 云雀大模型 / 腾讯混元 / 360 智脑等模型, 适配 LocalAI / Ollama 等模型 (LLaMa / RWKV / SDXL )等等。

  7. 最新模型支持:支持DeepSeek大模型deepseek-r1-671B 满血版、openai发布最新gpt-4.5大模型、claude-3-7大模型对接使用。最新4o高级画图功能模型(中文文字画图大模型支持)

  8. 01/03推理思考大模型支持:支持最新OpenAI最新o1、o3推理大模型(o3-mini、o3-mini-all、o3-mini-high、o3-mini-high-all、o1-mini、o1-mini-all、o1-preview、o1-preview-all)等。

  9. 完全自定义模型对接:所有模型走OpenAI的输入格式,当OpenAI发布新的语言模型,可后台第一时间添加,无须系统每次开发对接才能使用!同理支持对接了其他三方模型的中转系统。即OpenAI全模型、三方大模型、国内大模型 最新发布模型快速可用。对话模型自定义分类、自定义名称自定义排序、以及部分功能自定义。

  10. 开放性多平台API知识库+工作流应用对接(例如coze工作流智能体FastGPT知识库应用FastGPT工作流应用:请求对话接口兼容chat接口,支持对接OpenAPI 对话接口的知识库或工作流应用,其他平台API可通过one api等中转系统将其转成chat标准格式,对接api,以模型展示方式或绑定模型到智能体进行使用,即可将其他平台API知识库或工作流应用对接到本系统!

  11. AI智能体系统GPTs应用+Prompt自定义预设应用支持OpenAI官方商店全部GPTs应用接入。GPTS-支持GPTS后台自定义添加、也可以全站搜索 = 官方搜索。

  12. 独立AI视频生成功能:支持文生视频/图生视频(PIka AI视频)。

  13. 即将支持SoraAI视频生成:(待官方开放API)。

  14. 自研渠道均衡负载和分配算法,:支持多渠道高并发调用管理, 支持多 API Key 轮询! (优先级/权重/状态管理)。

  15. 完整的管理后台:完整用户后台管理与数据统计。

  16. 用户数据同步:对话会话隔离、云端存储、支持多设备共享数据。

  17. 多模态模型支持:识图、文档分析支持;支持自定义对话模型开启多模态支持。

  18. 支持联网模式:可对模型进行扩展搜索当前网络实时内容总结。

  19. TTS语音识别 :支持 OpenAI / Azure 等语音识别 & TTS 模型,支持 Whisper & TTS 格式中转;支持TTS对话输入回复模式。

  20. Midjourney绘画全功能:支持 Imagine / Upscale / Vary / Zoom Out 等众多功能, 支持 Seed 获取。支持 中转API / 支持局部重绘 (Vary Region)等等。

  21. 专业绘画系统:文生图、图生图、垫图混图、角色一致参考图、风格一致参考图生成等、AI换脸、混合图片生图。

  22. AI画廊广场:系统推荐开放系统;支持绘画作品分类展示。

  23. 创作者中心:绘画作品创作者信息展示(后续开发完善各项相关功能)。

  24. 轮播图展示:支持广告位、活动、教程文档展示功能。

  25. Dall-E-2/3绘画支持:支持所有参数并享有单独模块。

  26. 强大 Markdown 语法支持: (支持 代码高亮 / LaTeX 公式 / Mermaid 思维导图 / 图表绘制), 支持集成对话绘图模型 (DALL-E / Stable Diffusion / Midjourney 等)。

  27. 开箱即用的文档解析服务:支持 Pdf / Docx / Xlsx / 音频 / 图片等文件类型解析。

  28. 存储系统:支持本机、阿里云OSS、腾讯云cos、Chevereto图床多种类型。

  29. 会员系统: 提供普通模型积分、高级普通模型积分、绘画积分三种货币类型、支持各类商品自定义扣费模式与额度。支持自定义模型扣除费用类型、多种计费方式:按时间限制、无时间限制、自定义组合套餐设置 (免费 / 积分(次数)扣费 计费)。

  30. 支付系统:支持官方微信支持、易支付、码支付、虎皮椒支付等支付方式, 支持同步检查订单状态, 支持订单搜索和管理。

  31. 商城系统:自定义商品套餐、可自定义生成永久套餐、限时套餐。

  32. 签到系统:支持配置每日签到赠送不同额度的奖励。

  33. 访客系统:支持不登录使用部分内容、可游客模式体验站内功能。

  34. 邀请系统:推广邀请奖励,支持邀请和被邀请用户设置自定义积分奖励。

  35. 分销系统:支持 A + B 分销模式、后台可自定义分销提成额度、可对单独用户单独设置。支持设置提现门槛选项,支持用户多种提现方式选择(支付宝、微信、银行卡等)。

  36. 卡密系统:支持批量生产卡密供用户兑换、用户端可兑换卡密或三方卡网购买支持完备卡密兑换码体系, 支持自定义点数, 支持批量生成和卡密兑换码管理, 支持卡密兑换码查看领取用户 / 创建时间 / 领取时间等信息;删除卡密兑换码等功能。

  37. 登录系统:支持 邮箱 | 手机短信 | 微信扫码 等不同登录注册方式供选择。

  38. 插件系统:内部支持各类插件并会持续开发更多插件。

  39. 多端支持:自适应布局、适配PC、移动端、平板等设备。支持 Web / PWA / App / 小程序(后续开发), UI 移动端适配, 支持明暗主题切换, 支持 Windows / MacOS / Linux / Android / iOS App。

  40. 专业站点管理系统:支持自定义配置网站 LOGO / 站点名称 / 页脚 / 百度统计/ AI名称 / 版权信息/ 联系方式 / 站点公告 / 提示欢迎语等多种内容等多种内容;支持设置用户初始点数, 单独用户群配置 等等。

  41. 数据统计:丰富美观的仪表盘统计,支持每日新增用户数量统计 / 总计和每日对话数量 / 总计和每日新加绘画数量 / 总计和每日日订单数量统计 / 等多种信息统计图表趋势展示。

  42. 风控系统:内容敏感词多种限制、支持自定义敏感词/百度内容审核等安全检测、可共同开启。支持敏感词检查记录查询统计!

  43. 动态菜单系统:自定义板块嵌入网站页面, 支持设置板块图标,使站点更加丰富多样。支持内嵌网页、外部链接跳转、内部路径跳转、可以自定义开关菜单、添加菜单、自定义ICON、自定义菜单类型、可使用三方站点内嵌、支持移动端PC端各自单独设置。

  44. 权限系统:管理端支持超管和普通演示账户用于分销系统、普通账号仅可读权限

  45. 自动回复机制:管理端支持配置关键词回复、可自定义关键词及回复内容,可联动微信公众号。

  46. 持续更新:更多AI能力持续开发更新中...

系统快速体验

三、系统功能模块

3.1 AI全模型支持/插件系统

AI大模型

多模态模型文档分析

多模态识图理解能力

联网搜索回复总结

3.2 AI智能体应用

3.2.1 AI智能体/GPTs商店

GPTs应用+Prompt自定义预设应用、可全网搜索使用

3.2.2 AI智能体/GPTs工作台

3.2.3 自定义创建AI智能体应用

3.3 AI专业绘画

3.3.1 文生图/图生图/参考图生图

3.3.2 局部编辑重绘

3.3.3 混图生图

3.3.4 AI换脸

3.4 AI视频生成

支持文生视频 / 图生视频、可生成15秒视频

3.5 Dall-E2/E3绘画

3.6 智能思维导图生成

3.7 AI绘画广场

画廊广场

创作者中心

3.8 登录模块系统

支持微信环境静默登录、浏览器中微信主动扫码登录、邮箱注册登录、手机号注册登录

3.9 H5移动端(部分)

3.10 管理后台(部分)

其他和后台页面太多功能,就不展示了,直接访问演示站点和演示后台。

四、部署教程(Node.js + PM2 部署)

这里使用标准Node.js + PM2 部署项目,系统提供Docker一键快速部署教程

当你进入这个栏目的时候说明你已经想要使用宝塔面板部署了、如果你不知道什么是宝塔、那么请前往宝塔官网进行简单的了解、我们默认你已经安装了宝塔面板、这是最基础的需要。

第一步 4.1 环境安装

宝塔需要安装的环境

  • Nginx >= 1.19.8

  • MySQL >= 5.7或MySQL 8.0

  • PHP-7.4(非系统需要环境)

  • PM2管理器 5.5

  • Redis 7.0.11

  • Node版本:>=v16.14.1

​​​

初始安装环境推荐使用LNMP一键环境套件

​​​​​

第二步 4.2 Node版本选择

使用PM2切换Node版本(必须)

  • 切换Node版本为:大于等于v16.14.1(这里为v16.19.1)

​​​​​

第三步 4.3 安装pnpm模块

(宝塔默认会安装pnpm 9 的最新版本,此版本要求Node.js版本最低为18,很多linux版本不支持最新pnpm 9)

​​​​

先设置npm为官方源:

npm config set registry https://registry.npmjs.org/

单独安装pnpm:

请直接安装pnpm 8 的版本

npm install -g pnpm@8

​​​​​

此时再次打开终端、确定我们需要是否有node相关环境

分别执行以下命令,出现版本号说明已经安装成功

node -v
npm -v
pnpm -v

​​​​​

验证pm2环境是否存在:

pm2 -v

如果提示 pm2: command not found,则并没有成功安装,再次手动命令安装: 

npm install -g pm2

再次输入 pm2 -v 显示以下页面,则成功安装

​​​​

第四步 4.4 安装Redis

​​​​​

第五步 4.5 部署跑起来

4.5.1 新建站点

宝塔 - 网站 - 添加站点

​​​​​

4.5.2 配置SSL证书

如果自己没用商业SSL证书,就使用宝塔免费证书,申请Let's Encrypt 证书

​​​​​

开启强制HTTPS并保存

​​​​​

4.5.3 上传SparkAi系统源码

进入网站站点根目录

​​​​​

删除新建站点生成默认文件

​​​​​

将系统程序上传并解压到网站根目录下​

解压源码包

​​​​​

4.5.4 配置.env文件

复制一份.env.example文件,并重命名为 .env 文件

​​​​​

修改.env 配置文件为自己站点信息​

  • 其中mysql为必配项目、redis服务必须安装 否则无法启动项目
  • jwt token 必须修改为自己个人的密钥(再原有基础上再加一点随机英文即可)

4.5.5 启动项目

4.5.5.1 开启端口

宝塔面板安全开启9520端口(如果在配置文件自定义了其他端口,开启对应端口即可,不要和系统一些端口冲突,建议默认9520端口)

​​​​​

4.5.5.2 安装依赖

直接在网站根目录打开ssh终端

​​​​​

如果打开不在网站根目录请切换为网站根目录

cd /www/wwwroot/你的网站目录

宝塔默认为淘宝旧源,请切换淘宝最新源:

npm config set registry https://registry.npmmirror.com

使用 pnpm i 命令 回车 安装依赖

​​​​​

使用 pnpm start 命令启动项目

pnpm start

​​​​

4.5.5.3 查看启动日志

输入 pm2 log 查看详细日志、看到下图表示成功!

pm2 log

初始化创建super用户成功、用户名为[super]、初始密码为[sparkai]

4.5.6 添加反向代理

添加站点 9520 端口,宝塔安全需要开启该端口,不然无法访问

目标url:http://127.0.0.1:9520

​​​​​

4.5.7 搭建完成

搭建完成,访问域名,输入域名授权码即可

第六步 5.6 授权激活系统

访问你自己的系统前台域名

4.6.1 未授权激活

​​​​​

5.6.2 激活成功示例

5.6.3 访问用户前端

完成。 

<think>嗯,用户问的是如何通过DeepSeek搭建私有化企业级RAG文件知识库。首先,我需要明确用户的需求。他们可能是一个企业用户,想要在自己的内部系统中构建一个基于RAG(检索增强生成)模型的知识库,用于处理内部文档,提高信息检索和问答的效率。同时,用户强调“私有化”,说明他们对数据安全和隐私有较高要求,不希望数据泄露到外部。 接下来,我需要回想一下RAG的基本原理。RAG结合了检索和生成两个步骤,首先从大量文档中检索出相关的信息,然后利用生成模型(如GPT)生成回答。搭建这样的系统需要几个关键组件:文档处理、向量数据库、检索模型和生成模型。 然后,DeepSeek这个平台或工具可能提供了一些功能来支持这些步骤。我需要确认DeepSeek的具体能力,比如是否提供文本嵌入模型、是否支持私有化部署的向量数据库,或者是否有现成的API接口。如果用户提到的DeepSeek深度求索公司的产品,可能他们有相关的企业级解决方案。 接下来要考虑搭建的步骤。通常,搭建RAG系统包括数据准备、文档切分、向量化存储、检索和生成几个阶段。对于私有化部署,可能需要本地服务器或私有云环境,确保数据不离开企业内网。 用户可能还关心具体的技术细节,比如使用哪些工具进行文档处理,比如LangChain或者LlamaIndex,或者是否需要自己训练模型。此外,安全性方面需要考虑访问控制、数据加密等措施。 另外,用户可能没有明确说明他们的技术基础,是否需要详细的步骤指导,或者更倾向于使用现有平台的服务。比如,DeepSeek是否提供了一站式的解决方案,还是需要结合其他开源工具。 可能还需要考虑扩展性和维护问题,比如如何处理新增文档,更新向量数据库,以及系统的性能优化等。 现在,需要将这些思考整理成一个清晰的步骤指南,涵盖从环境准备到部署维护的全流程,并强调私有化部署的安全措施,确保用户能够理解并实施。</think>搭建私有化企业级RAG(Retrieval-Augmented Generation)文件知识库需要结合深度学习模型、向量数据库和私有化部署能力。以下是基于DeepSeek或其他类似技术的实现步骤框架,重点聚焦企业级安全与定制化需求: --- ### **一、核心架构设计** 1. **技术选型** - **LLM模型**:选用DeepSeek-R1等支持私有化部署的大模型(需确认官方授权) - **向量模型**:Sentence-BERT、BGE或DeepSeek自研Embedding模型 - **向量数据库**:Milvus/Chroma(开源)或私有化商业方案(如腾讯云VectorDB) - **框架支持**:LangChain/LlamaIndex用于流程编排 2. **私有化要求** - 部署于企业内网/私有云(如OpenStack/K8s集群) - 数据全链路加密(传输TLS/静态AES- 访问控制(RBAC权限体系+审计日志) --- ### **二、实施步骤详解** #### **1. 环境准备** - **硬件**:GPU服务器(至少NVIDIA A10/A100)用于模型推理 - **容器化**:Docker/Kubernetes部署各模块(模型服务、数据库等) - **网络隔离**:通过VPC/防火墙限制外网访问 #### **2. 文档处理流水线** ```python # 示例:使用LangChain处理文档 from langchain.document_loaders import DirectoryLoader from langchain.text_splitter import RecursiveCharacterTextSplitter # 加载企业文档(支持PDF/DOCX/Excel等) loader = DirectoryLoader('/data/docs', glob="**/*.pdf") docs = loader.load() # 智能分块(保留上下文) splitter = RecursiveCharacterTextSplitter( chunk_size=500, chunk_overlap=50, length_function=len ) chunks = splitter.split_documents(docs) ``` #### **3. 向量化与存储** - **私有化Embedding服务**: ```bash # 部署DeepSeek Embedding模型API docker run -p 8080:8080 deepseek/embedding:v1.0 --api-key="YOUR_LICENSE_KEY" ``` - **向量数据库初始化**: ```python from pymilvus import connections, CollectionSchema, FieldSchema, DataType connections.connect(host="10.0.0.10", port="19530") # 定义企业专属Schema fields = [ FieldSchema(name="id", dtype=DataType.INT64, is_primary=True), FieldSchema(name="embedding", dtype=DataType.FLOAT_VECTOR, dim=1024), FieldSchema(name="metadata", dtype=DataType.JSON) ] collection = Collection("enterprise_kb", schema=CollectionSchema(fields)) ``` #### **4. RAG服务搭建** - **检索增强层**: ```python from langchain.retrievers import MilvusRetriever from deepseek import DeepSeekChat retriever = MilvusRetriever( collection_name="enterprise_kb", embedding_function=deepseek_embedding ) rag_chain = ( {"context": retriever, "question": RunnablePassthrough()} | prompt_template | DeepSeekChat(model="deepseek-r1-enterprise") ) ``` #### **5. 安全增强措施** - **数据脱敏**:在向量化前进行敏感信息识别与掩码 - **模型微调**:使用企业专有数据做Domain Adaptation - **访问控制**:集成企业AD/LDAP实现单点登录 -- ### **三、企业级功能扩展** 1. **版本控制**:文档更新时保留历史版本向量记录 2. **多模态支持**:扩展处理图纸/图片中的OCR文本 3. **监控告警**:Prometheus+Grafana监控QPS/延迟 4. **灾备方案**:跨机房数据库集群+模型热备 --- ### **四、注意事项** 1. **合规性**:确保符合GDPR等数据保护法规 2. **冷启动**:初期需人工审核生成结果建立评估基准 3. **成本控制**:采用混合精度推理降低GPU消耗 建议联系DeepSeek商务团队获取企业版SDK及部署支持,同时可参考Azure AI Search+RAG等成熟方案进行架构验证。实际部署时建议分阶段实施,从试点部门逐步扩展到全企业。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

白云如幻

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值