DeepSeek的横空出世,在全球人工智能领域引发广泛关注。DeepSeek-R1作为该系列最新迭代版本,实现了长文本处理效能跃迁、多模态扩展规划、嵌入式适配等技术维度的突破。本文将介绍如何在飞凌嵌入式RK3588开发板上部署DeepSeek-R1大模型。
01 移植过程
(1)下载DeepSeek-R1源码
在Ubuntu虚拟机上从DeepSeek-R1官网地址下载DeepSeek-R1-Distill-Qwen-1.5B权重文件。
(2)安装转换工具
在Ubuntu创建虚拟环境并安装RKLLM-Toolkit,以便将DeepSeek-R1大语言模型转换为RKLLM模型格式和编译板端推理的可执行程序。
(3)模型转换
使用RKLLM-Toolkit对模型进行转换,RKLLM-Toolkit提供模型的转换、量化功能。作为RKLLM-Toolkit的核心功能之一,它允许用户将Hugging Face或GGUF格式的大语言模型转换为RKLLM模型,从而将RKLLM模型在Rockchip NPU上加载运行。
(4)编译DeepSeek-R1程序
安装交叉编译工具链,以编译RKLLM Runtime可执行文件,该程序包含模型初始化、模型推理、回调函数处理输出和模型资源释放等全部流程。
(5)模型部署
将编译好的RKLLM模型和可执行文件上传至板端即可执行,这样就可以在OK3588-C开发板的调试串口上和DeepSeek-R1对话了,而且无需联网。