什么是 DeepSeek R-1?
Deepseek R-1 被公布为一个完全开源模型,这意味着任何人都可以采用底层代码库,对其进行调整,甚至根据自己的需要进行微调。
从技术角度来看,Deepseek R-1(通常缩写为 R1)源自一个名为 DeepSeek-V3 的大型基础模型。实验室随后通过对高质量人工标记数据进行监督微调 (SFT) 和强化学习 (RL) 相结合的方式完善了该模型。聊天机器人可以处理复杂的提示,揭示复杂问题背后的推理步骤(有时比其他模型更透明),甚至在聊天界面中呈现代码以便快速测试。
说实话,这非常令人印象深刻,特别是对于开源模型而言。
如何在本地运行
为了在本地运行 DeepSeek R-1,我们将使用名为Ollama的工具。
Ollama 是一款免费的开源工具,允许用户在计算机上本地运行大型语言模型 (LLM)。它适用macOS、Linux 和 Windows。
前往 Ollama 官方网站并点击“下载”按钮。将其安装到您的系统上。
为了确认安装成功,打开终端并运行以下命令:
ollama -v
您应该会看到 Ollama 的版本号而不是错误。
在“模型”选项卡下,搜索关键字“deepsee