解决deepseek r1模型输出＜think＞标记问题

jenken1209

已于 2025-02-08 15:24:16 修改

阅读量7.8k

点赞数 11

文章标签： deepseek reasoning think标签

于 2025-02-08 14:30:37 首次发布

本文链接：https://blog.csdn.net/jenken1209/article/details/145515096

版权

升级vllm版本

vllm版本>= 0.7.1
在正常vllm serve 推理命令后增加 --enable-reasoning --reasoning-parser deepseek_r1
例如：

vllm serve /path/to/model --gpu-memory-utilization 0.95 --max-model-len 40000 --served-model-name "DeepSeek-R1-14B" --kv-cache-dtype="fp8_e4m3" --calculate-kv-scales --port 30001 --enable-reasoning --reasoning-parser deepseek_r1

kv cache量化

这里我为了增加模型上下文，启用了kv cache fp8量化，因为推理模型输出非常多，上下文自然是多多益善

效果验证

客户端侧，目前知道chatbox等接受reasoning_context参数。用1.9.8版本的chatbox对接vllm的接口，可以发现已经有思维链展示，而不是将思维链放在<think> </think>之间了

参考内容：

Reasoning Outputs — vLLM

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

jenken1209

关注关注

11
点赞
踩
9

收藏

觉得还不错? 一键收藏
2
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

[Dify] 去除 Ollama Deepseek 中＜think＞内容，仅保留答案部分的实现方案

技术就是小甜甜博客

04-14

768

本文介绍了一个用于处理 Ollama Deepseek 输出的 Python 工具函数，它能有效去除<think>标签中的“思考过程”，只保留用户所需的答案。此方法简洁高效，适用于 Dify 等模型调用平台的结果处理模块。

【技术解密】深入解析 DeepSeek R1：强化学习如何驱动大模型推理能力的进化

海棠AI实验室

02-01

9564

本文将深入解析 DeepSeek R1 的架构、训练方法和对比实验，并从多维度审视其局限性与未来发展方向。同时，我们也会在文中介绍 DeepSeek R1 蒸馏到多个小规模模型的过程及其在下游任务的效果表现，以期为学术与开源社区提供可参考的实践经验。

2 条评论您还未登录，请先登录后发表或查看评论

关于deepseek，千问qwq32B等大模型没有开始＜think＞问题的解决方案！

最新发布

ssp584731180的博客

03-12

999

【代码】关于deepseek，千问qwq32B等大模型没有开始<think>问题的解决方案！

DeepSeek 保姆级本地化部署教程

xxue345678的博客

02-07

5647

由于电脑性能不够强大，本地部署的反应速度还不够极致和丝滑。同时，由于内存限制，目前只使用了 7B 参数版本（该版本为“蒸馏版”）。更多关于本地部署的应用，可以再多多挖掘。DeepSeek无疑是2025开年AI圈的一匹黑马，在一众AI大模型中，DeepSeek以低价高性能的优势脱颖而出。DeepSeek的上线实现了AI界的又一大突破，各大科技巨头都火速出手，争先抢占DeepSeek大模型的流量风口。DeepSeek的爆火，远不止于此。

【DeepSeek部署】vllm部署deepseek，推理过程和答案分开。

扶着老奶奶闯红灯

02-28

1490

vllm部署deepseek，推理过程和答案分开。推理模型会在输出中返回额外的 `reasoning_content` 字段，该字段包含导致最终结论的推理步骤。其他模型的输出中不存在此字段。

用SGLang部署的DeepSeek R1推理时没有输出＜think＞标签

不负热爱

02-27

2078

DeepSeek R1推理时开头没有输出<think>标签

DeepSeek-R1 think 标签 markdown 渲染

JOEOP BLOG

02-20

2331

DeepSeek-R1 think 标签 markdown 渲染

DeepSeek R1果然有点意思! Windows本地使用ollama轻松跑起来。

托尼不是塔克

01-24

2608

这段时间国内外讨论DeepSeek的人都比较多，我印象比较深的是，Deepseek用较低的成本训练了一个不错的模型。另外通知下，公众号启用了智能回复功能，就是接入了腾讯的大模型，并且以以往的文章作为知识库。在问答过程中，7B的模型大概用了8G的显存，回答速度快到飞起，基本一行一行，刷刷的输出。Ollama 是一个开源的、易于使用的本地大语言模型（LLM）运行平台，简单，高效，可以扩展，可以运行各种主流模型。我问了三个问题“你是谁”，“你能做什么”，“你有什么优势”，它都给了我一样的答案，我不是太满意啊。

DeepSeek API 输出解析【非流式输出篇】 - OpenAI SDK

Hoper-J的博客

02-11

1925

关于 OpenAI SDK 的通用知识，以 DeepSeek 聊天/推理模型为例进行演示： - 认识 API 的返回字段 - 打印模型回复和每次对话的用量信息

解决java 使用中文调用deepseek api，返回的json数据乱码

诗水人间

02-26

1112

通过api调用，发送你好deepseek返回了下面这些内容发现很多乱码，我全局使用的是UTF-8编码。

使用 SGLang本地部署Deepseek R1

m0_74165632的博客

01-27

7584

使用 SGLang本地部署Deepseek R1

DeepSeek-R1 思考部分返回：<think>xxx</think>

02-28

为了使 `DeepSeek-R1` 的 `<think>` 标签能够被正确处理并渲染，可以采用自定义解析器来实现特定的Markdown渲染效果。具体来说，在项目环境中安装 `rehype-raw` 插件可以帮助完成这一目标。 #### 安装依赖包首先...

ollama部署的DeepSeek-R1 32B OpenAI格式API调用输出的<think> </think>方式改为 reasoning_content方式

02-25

为了使 Ollama 部署的 DeepSeek-R1 32B 模型能够通过 OpenAI 格式的 API 调用返回 `reasoning_content` 字段而不是 `<think>` 标签，可以采取以下方法： #### 自定义模型输出处理逻辑如果当前使用的框架允许...

阿里推出全新推理模型（因果语言模型），仅1/20参数媲美DeepSeek R1

AI人工智能的学习之路

03-06

1097

DeepSeek-R1：通过强化学习提升大型语言模型推理能力的探索

斯人若彩虹，遇上方知有！

02-04

2066

此外，通过模型蒸馏技术，研究者成功地将DeepSeek-R1的推理能力赋予了小型模型，使其在推理任务上的表现得到了显著提升。推理导向的强化学习：在冷启动数据的基础上，DeepSeek-R1采用了与DeepSeek-R1-Zero相同的强化学习训练过程，专注于提升模型在推理密集型任务中的表现。性能提升：在AIME 2024基准测试中，DeepSeek-R1-Zero的Pass@1分数从最初的15.6%提升至71.0%，经过多数投票后，分数进一步提升至86.7%，与OpenAI-o1-0912的性能相当。

DeepSeek-R1复现方案梳理

yanqianglifei的专栏

02-12

1236

在 100 步时，解方程的成功率约为 25%，并且模型开始用文字进行 “推理”;近日，来自UC伯克利的研究团队基于Deepseek-R1-Distilled-Qwen-1.5B，通过简单的强化学习（RL）微调，得到了全新的DeepScaleR-1.5B-Preview。由huggingface组建，目前刚上线2周，发布了最新进展open-r1/update-1，在MATH-500任务上接近deepseek的指标，可以在open-r1/open-r1-eval-leaderboard查看指标的排行榜。

如何完美解锁DeepSeek-R1的结构化输出能力（基于LangChain）？

xxue345678的博客

02-18

1339

DeepSeek-R1这样的推理模型有着强大的深度思考能力，但也有着一些不同于通用模型的特点与用法，比如不支持函数调用，不支持结构化输出，o1甚至不支持系统提示(System Prompt)等。可能大家都想学习AI大模型技术，也想通过这项技能真正达到升职加薪，就业或是副业的目的，但是不知道该如何开始学习，因为网上的资料太多太杂乱了，如果不能系统的学习就相当于是白学。掌握DeepSeek对于转行大模型领域的人来说是一个很大的优势，目前懂得大模型技术方面的人才很稀缺，而DeepSeek就是一个突破口。

简话 DeepSeek 本地部署及接口调用