本文介绍了如何快速稳定的使用满血版的DeepSeek R1,,实现DeepSeek平替自由
DeepSeek 是什么?
DeepSeek 是由深度求索(DeepSeek)自主研发的高性能大语言模型,以其开源、轻量化和强大的多场景能力受到广泛关注。
为用户提供智能对话、逻辑推理、AI搜索、文件处理、翻译、解题、创意、写作、编程等等多种服务。
最新发布的 DeepSeek R1 满血版不仅在性能上媲美了 OpenAI 的 o1、o3,且以对手 3% 的超低成本实现了这一突破。
DeepSeek 官网
已接入 DeepSeek R1(官方平替)
- 🔥AI智慧岛:chat.deepseek-free.org - DeepSeek网页版,支持 DeepSeek R1满血版、V3模型、支持联网搜索~
- 🔥一下 AI:www.yixiaai.com - DeepSeek官方平替,支持DeepSeek、ChatGPT 和 Claude最好的模型
- 秘塔 AI:访问
- 纳米 AI:访问
- Cursor:访问
- POE:访问
- 国家超算互联网:访问
DeepSeek 入门指南
DeepSeek 模型介绍:
- DeepSeek LLM:基础大型语言模型系列,包含7B和67B规格。其中,DeepSeek LLM 7B Chat 为7B规格的聊天交互模型,DeepSeek LLM 67B Chat 为67B规格的聊天交互模型,并推出了性能超过其他开源模型的16B参数版本混合专家模型。
- DeepSeek-Coder:专为代码生成打造的模型,专注于代码生成、补全、修复及数学推理任务。升级版本DeepSeek-Coder V2在代码智能领域取得显著突破。
- DeepSeek-Coder V2:在 DeepSeek-V2 中间检查点基础上,额外预训练了 6 万亿 tokens 的代码和自然语言数据,显著增强了编码与数学推理能力,同时保持通用语言任务的优异表现。支持的编程语言从 86 种扩展至 338 种,覆盖主流及小众语言,适应多样化开发需求。凭借MoE架构、大规模预训练和多语言支持,DeepSeek-Coder V2 成为代码智能领域的标杆开源模型,其在编码、数学推理和通用任务中的表现挑战了闭源模型的垄断地位。
- DeepSeek-V2:发布于2024年上半年,DeepSeekMoE的改进版,采用更多数据,提升数据质量并优化了训练流程,专注于文本生成、代码生成和低成本训练。
- DeepSeek-V2.5:是 V2 系列的升级版本,发布于2024年9月,介于 V2 和 V3 之间。
- DeepSeek-V3:发布于2024年12月,第三代模型,性能强劲。通过FP8混合精度训练、无辅助损失负载均衡等技术创新,V3实现了高效训练与推理,并支持128K长上下文处理。生成速度从V2的20 TPS提升至60 TPS,速度提升3倍。V3在知识问答、长文本处理、代码生成等领域表现超越其他开源模型,并在数学竞赛中超越闭源模型如GPT-4。该模型推出后,成为开放源代码模型中的领跑者。
- DeepSeek-R1:专注于推理能力的模型,通过强化学习与多阶段训练流程深度优化。包括DeepSeek-R1-Zero,完全基于强化学习训练的早期版本;DeepSeek-R1-32B,有320亿参数,可在24GB显存显卡上流畅运行;DeepSeek-R1-8B,有80亿参数,适用于8GB显存显卡。
- DeepSeek-VL:视觉语言模型,能够处理图像与文本信息融合。DeepSeek-VL2是其升级版,多模态理解能力更强。
- DeepSeekMath:专注于数学推理的模型。
- DeepSeek-Prover:用于定理证明的模型,通过大规模合成数据进行训练,DeepSeek-Prover V1.5结合强化学习与蒙特卡洛树搜索技术进行了优化。
- Janus-Pro-7B:基于视觉的模型,于2025年1月27日推出。
DeepSeek 主要功能:
- 智能对话:能够与用户进行高智商、顺畅的对话,像朋友一样交流,为用户答疑解惑。
- AI搜索:可全网搜索,让用户实时掌握信息,无论是知识查询还是热点追踪,都能快速搞定。
- 文件上传:支持上传文献书籍、资料报告等各类文件,帮助用户梳理重点,快速提取关键信息。
- 准确翻译:提供准确流畅的翻译服务,帮助用户跨越语言障碍,轻松融入多语言环境。
- 智能解题:能够解决理科难题,提供详细的解题思路和步骤,是学习的好帮手。
- 创意写作:能根据指令自动生成创意文案,撰写各类文章和报告,快速构建内容框架,提升写作效率。
- 高效编程:支持多种编程语言,可快速定位问题并生成代码,提高编程速度和质量。
DeepSeek 本地部署攻略:
推荐使用 Ollama 工具进行本地部署。Ollama不仅支持 DeepSeek,还可以运行其他多种AI模型~
1. 下载 Ollama
首先访问Ollama官方网站,根据你电脑的系统,下载对应版本的 Ollama,然后安装即可。
Ollama是一个用于本地运行和管理 AI 模型的工具,用于与各种模型进行交互。
你也可以在电脑上看到 Ollama 的图标,双击打开即可。
2. 下载 DeepSeek R1 模型
接下来需要打开电脑的终端命令行工具,输入命令 ollama run deepseek-r1:32b,后面的是模型尺寸
接着就可以正常下载 DeepSeek R1模型了
3. 测试 DeepSeek
下载完成后,直接在终端与 DeepSeek 对话,例如输入:“介绍一下你自己”。然后等待 DeepSeek 思考并回复即可。
4. 常用命令
整理一些常用 Ollama 命令,使用时将 {model_name} 替换成具体模型名称
- 安装模型:ollama pull {model_name}
- 运行模型:ollama run {model_name}
- 删除模型:ollama rm {model_name}
- 列出已安装模型:ollama list
DeepSeek 云部署 & API 调用
- 🔥硅基流动 x 华为云:注册
- 微软 Azure:注册
- 英伟达 :注册
- Cloudflare:注册
- Gitee AI:注册
- 亚马逊 AWS:注册
- 阿里云:注册 、 教程
- 腾讯云:注册 、 教程
- 百度智能云:注册
- 火山引擎:注册
- 京东云:注册 、 教程
- 华为昇腾社区:注册 、 教程
- 联通云电脑:注册
- 电信天翼云电脑:注册
- 移动云:注册
- 讯飞开放平台:注册