前言
DeepSeek(深度求索)作为中国量化投资机构幻方量化孵化的开源大模型企业,凭借三大核心创新正在人工智能领域掀起技术革新浪潮。其产品矩阵中,对标GPT-4o的deepseek-chat(DeepSeek-V3)对话模型与专注逻辑推理的deepseek-reasoner(DeepSeek-R1)双星并耀,在知识测试、代码生成等关键指标上已实现对Llama等国际竞品的超越,而尤为值得一提的是——这是完全自主研发的国产大模型!
DeepSeek 爆火的原因主要为三个维度:首创全面开源策略,开发者可自由调整模型架构,极大降低技术应用门槛;创新的MLA(混合精度架构)技术将推理成本压缩至主流模型的10%,其API服务价格仅为GPT-4o的九分之一;参数规模覆盖从1.5B到671B的完整产品谱系,为不同应用场景提供精准解决方案。
在本地化部署方面,通过Ollama框架可实现灵活适配。不同参数规模的模型对应差异化的硬件投入:1.5B/7B轻量级模型仅需0.5万至1万元级设备即可运行,适合个人开发者及小型企业;70B模型满足中等规模企业需求;而顶配的671B模型则面向科研机构及大型企业,部署成本可达50万至400万元量级。这种梯度化的产品布局,既保证了技术的前沿性,又实现了商业落地的可行性。
但是,对于我这种穷研究生而言,使用 Ollama 框架本地部署的成本还是有些高……所以,我选择使用官方提供的API,直接满血版,配合优秀的AI 助手平台。选来选去,选择:CherryStudio
获取 DeepSeek API(3分钟)
-
通过 [DeepSeek 官网](DeepSeek | 深度求索),手机号或者微信注册后,点击右上角 API开放平台;
-
点击 API keys,创建 API,名称随便填写,创建后记得点击“复制”,忘了的话,就再建个新的
不知道现在官方送不送10元体验金,没有的话,充值10元,体验一下,或者去薅第三方羊毛
安装 CherryStudio(3分钟)
引用其官网的描述:
CherryStudio 是一款集多模型对话、知识库管理、AI 绘画、翻译等功能于一体的全能 AI 助手平台。 CherryStudio的高度自定义的设计、强大的扩展能力和友好的用户体验,使其成为专业用户和 AI 爱好者的理想选择。无论是零基础用户还是开发者,都能在 CherryStudio 中找到适合自己的AI功能,提升工作效率和创造力
-
访问 Cherry Studio 官方网站 - 全能的AI助手,下载安装包
如果出现浏览器提示文件不被信任等情况选择保留即可
-
打开下载好的文件,安装,至于是所有用户还是仅为我安装,随便
配置 + 验证(4分钟)
配置
如上图,点击设置,选择模型服务,找到深度求索,填写 API 密钥,打开开关(会显示一个ON),最后检查模型连接,会有个连接成功的提示,如果没有,检查一下密钥是不是粘贴错了…
有个 钥匙🔑 的标识,表示可以 function call,也就是后续可以使用 CherrySudio 的 MCP
验证
进入对话窗口,选择刚配置好的模型,提问:“DeepSeek 1.5B、7B、70B、671B 指的是什么?”
絮叨
我呢,有个不好的习惯,喜欢观望,比如前段时间 DeepSeek 爆火,我一下就想到与之相关的基金应该会涨,但当时没有立马买入,心里总想着,再等等,再等等,观望一阵子,直到现在基金过了涨势,直接错过了“一个亿”;再比如,我可以写几篇相关的文章,蹭蹭热度……然而直到现在,火都要灭了,我才开始动手……
一句话:热点要尽快蹭!!