
DeepSeeK
文章平均质量分 94
火星求索
曾就职字节跳动,17年医疗健康行业的码拉松奔跑者,担任研发总监、架构师、技术专家负责和主导多个应用架构。
展开
-
【DeepSeek青桔系列】Ollama + AnythingLLM快速且简单的在部署DeepSeek
Ollama + AnythingLLM快速且简单的在部署DeepSeek,AnythingLLM 更专注于文档知识库与问答场景,自带向量检索管理,可“多文档整合”,接入 Ollama 后实现本地化问答。原创 2025-03-26 09:00:00 · 882 阅读 · 0 评论 -
DeepSeek-R1的内部实现分析
DeepSeek-R1 并不是从零开始训练的。它从一个比较强大LLM (DeepSeek-V3-base)开始,进而成为一个推理大模型。为了做到这一点,使用了强化学习(RL),当 LLM 做了一些有益于推理的事情时,进行奖励,否则进行惩罚。但这不仅仅是一次简单的训练,而是一系列阶段,称之为流水线。首先尝试纯 RL,看看推理是否会是否可行,这是 DeepSeek-R1-Zero,有点像一个实验。原创 2025-02-28 09:56:24 · 333 阅读 · 0 评论 -
DeepSeek-R1 32B 的本地部署
DeepSeek-R1-Distill-Qwen-32B 是一个通过知识蒸馏技术从小型化模型中提取推理能力的高性能语言模型。它是基于 DeepSeek-R1 的推理能力,通过蒸馏技术将推理模式迁移到较小的 Qwen 模型上,从而在保持高效性能的同时降低了计算成本。原创 2025-02-19 09:15:00 · 1709 阅读 · 0 评论 -
DeepSeek 本地部署+Chatbox可视化界面
内容主要包括Ollama的介绍与安装、如何通过Ollama部署DeepSeek、在ChatBox中使用DeepSeek。原创 2025-02-17 18:01:05 · 807 阅读 · 0 评论 -
【DeepSeek青桔系列】安装部署DeepSeek 可视化界面Open Web UI
Ollama部署后DeepSeek缺少可以交互的页面,我们使用Open WebUI,提供丰富的交互体验。 同时也可选择任意支持Ollama的webUI,如 AnythingLLM、Dify、Open-WebUI 等。原创 2025-02-07 08:30:00 · 1324 阅读 · 0 评论 -
【DeepSeek青桔系列】Ollama 部署 DeepSeek:AI 界的“拼多多”!
Ollama 部署 DeepSeek:AI 界的“拼多多”!DeepSeek版本选择模型版本:入门级:1.5B版本,适合初步测试。中端:7B或8B版本,适合大多数消费级GPU。高性能:14B、32B或70B版本,适合高端GPU。原创 2025-02-05 22:55:45 · 1194 阅读 · 0 评论