在香橙派AI Pro上部署DeepSeek 1.5B模型：从环境配置到模型推理的完整指南

最新推荐文章于 2025-02-22 17:15:01 发布

yqq️

最新推荐文章于 2025-02-22 17:15:01 发布

阅读量1.4k

点赞数 22

文章标签： python

本文链接：https://blog.csdn.net/qiqiaoya/article/details/145570887

版权

引言
香橙派AI Pro是一款性价比极高的开发板，适合AI开发和边缘计算。本文将详细介绍如何在香橙派AI Pro上部署DeepSeek 1.5B模型，包括环境配置、模型下载、参数优化以及推理测试的全过程，并分享一些常见问题的解决方法。

1. 环境准备

1.1 硬件准备

香橙派AI Pro：确保设备完好，电源适配器功率足够（建议5V/4A）。
存储设备：建议使用高速MicroSD卡（至少32GB）或外接SSD，以提升读写性能。
散热：香橙派AI Pro在高负载下可能会发热，建议配备散热风扇或散热片。

1.2 操作系统安装

下载Ubuntu 20.04 LTS镜像：
从香橙派官网下载适用于AI Pro的Ubuntu镜像：香橙派官方镜像。
使用工具（如Balena Etcher）将镜像烧录到MicroSD卡中。
插入MicroSD卡，连接显示器、键盘和电源，启动设备。
完成系统初始化设置（语言、时区、用户名等）。

1.3 系统更新与依赖安装

更新系统：

sudo apt-get update
sudo apt-get upgrade -y

安装必要工具：

sudo apt-get install -y git wget curl python3-pip

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

yqq️

关注关注

22
点赞
踩
26

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

人人都能上手部署DeepSeek-R1蒸馏模型：应用昇思+香橙派 AI Pro实践全流程

prtinf48_9的博客

02-11

2866

本文聚焦于高性能生成式AI模型DeepSeek在香橙派AI Pro开发板上的部署与优化，特别强调NPU加速的应用实践。文章首先介绍了DeepSeek模型的特点及其蒸馏技术的优势，随后详细阐述了香橙派AI Pro 20T开发板的硬件特性，包括高性能AI处理器和丰富的接口功能。核心内容围绕如何通过NPU加速实现DeepSeek模型的高效部署展开，详细介绍了烧录镜像、环境配置、模型运行及优化的完整流程。通过本文，读者可以快速掌握在香橙派AI Pro开发板上部署DeepSeek模型的方法，充分发挥NPU的加速能力。

把 DeepSeek1.5b 部署在显卡小于4G的电脑上

复兴号之编程复兴

02-12

3454

Deepseek1.5b能够运行在只用cpu和gpu内存小的情况下,经过试用,电脑只使用cpu是很慢的。

参与评论您还未登录，请先登录后发表或查看评论

只需三步，在几百块的香橙派 5 上跑 Deepseek R1

qq_29824567的博客

02-07

3254

8GB 版本也可以跑一些小模型: 比如 Llama 3.2, Phi3, Qwen 1.5B 等，回答速度杠杠的。我下载了最右上角的模型，点击进入 HuggingFace 页面，下载模型文件 📂。Deepseek-8B 8bit 量化版 (8GB, 5Max)虽然算力更高 (8-20 TOPs)，但发热严重，希望华为。Llama-7B 4bit 量化版 (4GB, 5Plus)Llama-7B 4bit 量化版 (4GB, 5Plus)8GB 版本，容易受限，推荐跑小于 8B 的模型。

神器！香橙派 5 Max 跑 Deepseek R1 等 AI 模型 (1)

qq_29824567的博客

01-30

4355

🤤 **6 TOPs NPU (神经网络计算单元)**：比 CPU/GPU 强很多，用来跑 AI 模型很香。如果你有什么感兴趣的用香橙派玩的项目推荐，欢迎在文末留言！之前看过我前几期内容的朋友，知道我有一个树莓派 4。，虽然聊胜于无，但也足够支持在小小的派上跑 AI 模型，Nice！您的鼓励和支持是我坚持创作的最大动力！也是个选择，但听说它的稳定性和软件支持不如。，这不甩树莓派几条街？最最最重要的是，它有。记得关注不走丢，第一时间看到后续更新！🚀 Ubuntu 安装指南。

【香橙派 AIpro 开发板】AI 应用部署测评：视频目标检测+Linux镜像+vscode远程连接+全细节试用

定期分享我的发现和想法，感谢你的陪伴和支持

05-30

5272

在人工智能和物联网技术日益成熟的今天，边缘计算设备因其在数据处理和实时性方面的优势而受到广泛关注。香橙派 AIpro（OrangePi AIpro）开发板以其出色的性能和丰富的应用场景，成为开发者探索 AI 应用部署的理想选择。有幸获得了邀请，并有幸邀请到了闪电[@shandainchengzi](https://shandianchengzi.blog.csdn.net/?type=blog)，和我一起对这款备受瞩目的开发板进行一次体验测评。下面将从新手个人开发经验出发，对香橙派 AIpro 开发板进

本地部署deep seek-R1轻量级1.5b

2401_86263733的博客

02-17

1185

下载地址：https://chatboxai.app/zh （Windows版本）这里以1.5B为例，复制以下命令在ollama上运行，等待安装。安装完成有success标志，接下来测试。本机配置：14核，内存16G。

本地部署DeepSeek-R1 1.5B

热门推荐

weixin_44502794的博客

01-22

1万+

然后输入ollama run deepseek-r1:1.5b。然后打开windows powershell。等待ollama下载完模型，就是可以使用了。然后安装ollama。

linux系统离线部署deepseek-r1:1.5b

qq_44772261的博客

02-10

2186

在目录/etc/systemd/system下创建文件ollama.service。3.1 找到空间大的地方，建立一个ollama文件夹，把压缩包上传上去，再解压。3.3 这个时候输入ollama，会提示没有该命令，因为没有设置全局可用。3.2 解压得到两个文件夹，进入到bin文件夹下，得到ollama本体。我是为了节约流量，直接运行的，同样道理，把文件拷贝到下方的目录下即可。文件下载到了/root/.ollama/models下。3.4 随便找个地方，输入ollama，发现可用即可。

win11通过ollama本地部署deepseek-r1:1.5b

李昂的博客

01-24

1万+

deepseek-r1:1.5b这个模型确实很轻量资源占用很少，应该也就占用1GB多点显存，但是也确实比较呆，很多问题都回答不上来，这里如果想要运行其他模型，可以参考ollama的技术文档https://ollama.readthedocs.io/quickstart/ 里面说明了其他模型运行的方式以及所需要的资源。下载完成后安装ollama，默认安装在c盘下面，这个通过默认安装方式无法更改模型就行，安装完成后可以打开CMD窗口输入。首次运行会自动下载模型，运行完成后就可以进行正常交互了。

DeepSeek是新源神！推理模型o1性能1/50价格，微调/数据/商用全免费，蒸馏1.5B小模型可比GPT-4o

m0_59164304的博客

01-21

2118

DeepSeek新发布远超预期，Reddit/𝕏狂暴刷屏中。这次大事共有3件：开源，与o1性能相近。‍‍开源，预训练模型直接RL，不走SFT，堪称语言模型的AlphaZero。开源用，在某些任务上直接超过GPT-4o。同时开放官方API，输入token（命中缓存）价格只有OpenAI o1的1/50，未命中缓存以及输出token价格约1/27。

本地部署 DeepSeek-r1:1.5b：测试工程师的效率革命，从繁琐到智能

weixin_44872675的博客

02-09

1449

从测试用例生成到日志分析，从自动化脚本辅助生成到问题定位，DeepSeek 几乎覆盖了测试环节的各个痛点，帮助测试工程师以更高效、更精准的方式完成工作。测试工程师需要手动编写大量的自动化测试脚本，尤其是在 Playwright、Selenium 等工具中，编写脚本不仅耗时，还容易因为业务变更导致脚本失效。在迭代开发中，需求文档和接口文档频繁更新，测试用例和脚本往往需要同步更新，增加了测试工程师的维护工作量。测试覆盖率和质量是评估测试工作的重要指标，但实际工作中，测试覆盖率往往难以量化，特别是手动测试环节。

人人都能上手部署DeepSeek模型：Janus-Pro香橙派开发板实践指南

最新发布

Kenji_Shinji的博客

02-22

814

下载完成后模型权重将保存在/home/HwHiAiUser/Janus-Pro-1B中，如果要保存在其他位置，请修改local_dir参数，并同步修改mindnlp/llm/inference/janus_pro/understanding.py和mindnlp/llm/inference/janus_pro/generation.py中的model_path修改为对应的目录地址。开发板启动后，开发板支持多种连接方式，如串口连接、网线连接等，请参考用户手册的2.9、3.5、3.6节，如下图所示，

DeepSeek是新源神！推理模型o1性能1/50价格，微调/数据/商用全免费，蒸馏1.5B小模型可比GPT-4o...

量子位

01-21

1216

梦晨发自凹非寺量子位 | 公众号 QbitAIDeepSeek新发布远超预期，Reddit/????狂暴刷屏中。这次大事共有3件：开源DeepSeek-R1推理大模型，与o1性能相近。‍‍开源DeepSeek-R1-Zero，预训练模型直接RL，不走SFT，堪称语言模型的AlphaZero。开源用R1数据蒸馏的Qwen、Llama系列小模型，在某些任务上直接超过GPT-4o。同时开放官方API，输入...

Windows本地部署（DeepSeek-R1-Distill-Qwen-1.5B）模型

qq1164014750

01-26

1万+

登录 WSL 后，根据 NVIDIA 下载页面的说明安装 CUDA 11.8，依次执行以下命令：也可以参考官方说明：https://developer.nvidia.com/cuda-downloads?https://modelscope.cn/models/deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B 国内 modelscope。

DeepSeek-R1-Distill-Qwen-1.5B：最佳小型LLM？

2401_84204207的博客

01-31

1万+

DeepSeek-R1的蒸馏模型是通过蒸馏技术从更大版本的DeepSeek-R1模型中提取出来的紧凑高效版本。这个过程将大型模型的知识和推理能力转移到更小的模型中，使它们能够在推理任务上表现良好，同时更加轻量、节省资源，并且更容易部署。DeepSeek-R1发布的不同蒸馏模型包括：DeepSeek-R1-Distill-Qwen系列：1.5B，7B，14B，32B。DeepSeek-R1-Distill-Llama系列：8B，70B。

显卡 4060 个人搭建 DeepSeek-R1-Distill-Qwen-1.5B deepseek 手把手搭建

二等碗

02-22

1383

由于大多数都是用 windows 环境，尝试搭建一个做测试，所以这边建议使用WSL 来下载一个Linux 系统，我这里就用Ubuntu 来演示。 deepseek 手把手搭建

DeepSeek-R1模型不同参数规模（1.5B、7B、8B、14B、32B、70B、671B）之间的区别

有天你会让我妒忌的

02-10

8312

DeepSeek-R1 系列模型的不同参数规模（如1.5B、7B、14B、70B等）代表了模型的参数量级，直接影响模型的。例如，用7B模型验证业务流程，再迁移到14B提升效果。建议先从小规模模型实验，再根据实际需求逐步升级。

【DeepSeek-R1 +1.5B】2060显卡ollama本地部署+open-webui界面使用

进一寸有一寸的欢喜

02-06

2847

deepseek-r1-1.5B本地部署, 仅需2G-3G显存

香橙派aipro部署deepseek

02-14

### 部署 DeepSeek 1.5B 模型于香橙派 AI Pro #### 环境准备为了确保能够在香橙派 AI Pro 上顺利部署 DeepSeek 1.5B 模型，需先完成必要的软件环境搭建工作。这包括但不限于安装操作系统、更新内核以及设置 Python 开发环境等前置条件[^1]。 ```bash sudo apt-get update && sudo apt-get upgrade -y sudo apt install python3-pip -y pip3 install --upgrade pip setuptools wheel ``` #### 安装依赖库针对 DeepSeek 这样的大型语言模型，除了基础的开发工具外，还需要额外引入一些特定的支持包来辅助加载和处理模型数据。这些支持包通常涵盖了 PyTorch 或 TensorFlow 等框架及其相关组件。 ```bash pip3 install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cpu pip3 install transformers datasets evaluate accelerate optimum ``` #### 获取并加载预训练模型接下来是从官方渠道下载预先训练好的 DeepSeek 1.5B 版本，并将其放置在一个合适的位置以便后续调用。考虑到存储空间可能成为瓶颈之一，在此之前建议确认设备有足够的剩余容量用于保存该大尺寸文件。 ```python from transformers import AutoModelForCausalLM, AutoTokenizer model_name_or_path = "path_to_deepseek_1.5b" tokenizer = AutoTokenizer.from_pretrained(model_name_or_path) model = AutoModelForCausalLM.from_pretrained(model_name_or_path) ``` #### 参数优化与性能提升鉴于香橙派 AI Pro 的硬件资源相对有限，适当调整某些超参数可以帮助提高运行效率而不显著影响最终效果。比如减少批处理大小(batch size)，降低精度(float16代替float32)等方式均有助于缓解计算压力。 ```python import torch device = 'cuda' if torch.cuda.is_available() else 'cpu' model.to(device).half() ``` #### 实现简单推理接口最后一步就是构建一个简易的服务端口或者命令行应用程序，允许用户输入提示词后得到由 DeepSeek 生产的回答文本作为输出结果。 ```python def generate_response(prompt): inputs = tokenizer(prompt, return_tensors="pt").to(device) outputs = model.generate(**inputs, max_new_tokens=50) response = tokenizer.decode(outputs[0], skip_special_tokens=True) return response if __name__ == "__main__": while True: user_input = input("请输入您的问题 (或按 q 键退出): ") if user_input.lower().strip() == 'q': break print(f"DeepSeek: {generate_response(user_input)}") ```