deep seek R1本地化部署及openAI API调用

weixin_44612246

已于 2025-02-02 16:40:46 修改

阅读量5.4k

点赞数 16

文章标签： python 神经网络自然语言处理人工智能

于 2025-02-02 16:34:08 首次发布

本文链接：https://blog.csdn.net/weixin_44612246/article/details/145420428

版权

先说几句题外话。

最近deep seek火遍全球，所以春节假期期间趁着官网优惠充值了deep seek的API，用openAI的接口方式尝试了下对deep seek的调用，并且做了个简单测试，测试内容确实非常简单：通过prompt提示词让大模型对用户提问做一个简单的提问场景判断，分了3个大类：一个是能耗问题，比如用户提问包括电流、电压、功率、能耗、耗能情况等等，判断为能耗问题。一个是生产问题，比如产量、产品等等，生产问题需要识别用户提问的日期范围之后转化为格式化输出，以便调用生产系统API获取数据。除此之外就是通用问题。

重点测试了生产相关的产量问题的日期范围测试，分别调用过讯飞的generalv3，智普的glm-4-plus，openAI的gpt-4o，提问比如上周的产量怎么样，不论我怎么调整提示词，generalv3都识别不出“上周”的时间范围，相同提示词的情况下，gpt-4o表现最好，识别的准确率最高，智普的glm-4-plus也还可以。

春节前用deepseek-reasoner试了下，对这个简单问题的表现很不错，因为我的openAI的apikey已经到期了所以没有办法对比测试了，但是单独测试deepseek-reasoner，每次都可以准确识别上周、上个月等时间范围。

其实这个测试是为了对function calling做一个简单的准备，验证一下将来如果有相关场景的话，是否可以通过funcation calling使大模型和业务系统做一个对接。前期测试结果并不能反映出模型是否支持我的业务场景，因为效果不好的直接原因可能就是我的提示词使用不当，不断优化提示词后应该能解决，因为问题确实非常简单。

好的，进入正题。

我的笔记本电脑配置很低，没有gpu，所以没有办法选择参数量比较大的模型做本地化部署，先选一个最小的，主要目的是验证一下本地化部署的步骤。

部署内容：

Ollama：Ollama是开源大模型部署或管理工具，提供了对大部分知名模型的支持，对外提供了openAI的api接口、以及聊天窗口
DeepSeek R1 1.5b：选了一个最小的模型，模型文件的大小是1.1GB，关键是推理过程中对GPU没有要求，我16g内存、无显卡的笔记本电脑，可以无障碍运行。
本地知识库搭建：搭建本地rag环境，安装embedding模型实现本地知识库的搭建（这一步还在摸索中，尚未找到合适的embedding模型，所以本次内

最低0.47元/天解锁文章