在Deepseek模型的落地应用中,我们期望它不仅能够给出准确答案,还能展示其推理过程。本文记录了我在LLamaFactory微调和测试DeepSeek蒸馏模型时遇到的思维过程展示问题,以及从问题发现到最终解决的全过程。通过对模型配置、提示模板和界面渲染的系统性优化,成功实现了蒸馏模型思考过程的直观可视化展示。
文章目录
问题背景
最近在本地环境中部署了DeepSeek-R1-Distill-Qwen-1.5B,即由Qwen2.5-Math-1.5B基础模型蒸馏出来的具有思维能力的模型。这是