前言
在deepseek-r1给出的deepseek-r1模型中有多个不同大小的模型,而除了671b模型是满血版的r1,其余模型均是通过该模型提炼而出。
针对满血版的r1模型,个人基本是无法本地部署的,对于32b模型,需要的显卡显存一般是24G,配备4090显卡24G显存较为合适。(注意,这里使用的判定条件为,32b对应大小是20GB(需要的显卡显存大于20GB比较好),虽然实际运行时使用的显存大小不会达到20GB)
671b模型需要多GPU并行计算,例如多张A100或H100。
如何使用满血版deepseek-r1
如需体验能对标到openai的o1模型,使用满血版deepseek-r1,则一般的使用途径为使用api进行调用。也就是使用第三方平台部署好的满血版r1,直接调用他们接口的r1服务,一般也是需要进行收费的,当然有些平台首次注册时也会赠送一定额度。下面本文介绍如何使用满血版的deepseek-r。
1、注册硅基流动统一登录
通过该平台注册可赠送2000万Tokens,够玩一整子了。
2、登录后构建API密钥
构建密钥成功后复制密钥
注意:在SiliconCloud平台中提供了诸多模型api,满血版的R1和V3都可通过api调用
3、使用cherry studio配置模型服务
cherry studio下载地址 :https://cherry-ai.com/
具体安装使用流程可参照:本地部署DeepSeek与国内大模型API接入_本地部署的deepseek cherry api-CSDN博客
点击管理后可增添需要的模型
4、使用满血版deepseek-r1/V3模型
在cherry studio中可选择刚才在硅基流动配置好api后选择模型进行使用,可在对话中随时切换模型使用
选择V3时,使用流畅
选择r1模型时则较慢,可能和第三方平台服务器繁忙或配置等有关