没显卡也能跑Deepseek-R1，还等什么，一起体验开源盛会吧

最新推荐文章于 2025-02-20 09:16:05 发布

木法星人

最新推荐文章于 2025-02-20 09:16:05 发布

阅读量734

点赞数 3

分类专栏：人工智能 Linux 文章标签： deepseek llama.cpp llama CPU跑AI

本文链接：https://blog.csdn.net/qq_42183962/article/details/145568235

版权

Linux 同时被 2 个专栏收录

23 篇文章

订阅专栏

人工智能

15 篇文章

订阅专栏

有台闲置的CentOS 8.5，正好给它装个Deepseek-R1，没有显卡故选用 llama.cpp，话不多说，上操作：
在这里插入图片描述

一.先克隆 `llama.cpp` 仓库并编译（😀用Ubuntu的有福了，有现成的可以直接下载llama-b4686-bin-ubuntu-x64.zip，跳过这步直接去看二）。

在这里插入图片描述

步骤

更新系统和安装依赖项
克隆 llama.cpp 仓库
编译 llama.cpp 项目

1. 更新系统和安装依赖项

首先，更新系统并安装必要的开发工具和依赖项。

sudo yum update -y
sudo yum groupinstall "Development Tools" -y
sudo yum install cmake git -y

2. 克隆 `llama.cpp` 仓库

使用 Git 克隆 llama.cpp 仓库。

git clone https://github.com/ggerganov/llama.cpp.git
cd llama.cpp

3. 编译 `llama.cpp` 项目（挺慢的，需耐心等待）

创建构建目录并编译项目。

mkdir build
cd build
cd llama.cpp

# 4、编译llama.cpp，创建构建目录build，并进行静态编译
cmake -B build -DBUILD_SHARED_LIBS=OFF

#！！注意！！ Linux自带的gcc版本比较低，我这是8.5版本，需要修一个编译配置文件:

vim ./ggml/src/CMakeLists.txt

在225行后面添加一行：link_libraries(stdc++fs)

加完效果如下，记得保存：
在这里插入图片描述

并行构建项目，这台机只有双核，故设置为 2 个并行任务

cmake --build build --config Release -j 2

在这里插入图片描述

4. 检查编译结果：

成功编译后的输出如下：
在这里插入图片描述

到这一步，这台CentOS 8.5 系统已经可以运行 `llama.cpp`了，只缺个大模型。

二.安装Deepseek-R1 蒸馏模型

安装huggingface_hub

python -m pip install -U huggingface_hub

下载R1-1.5B（qwen2蒸馏）模型文件

huggingface-cli download unsloth/DeepSeek-R1-Distill-Qwen-1.5B-GGUF DeepSeek-R1-Distill-Qwen-1.5B-Q4_K_M.gguf --local-dir .

跑起来

./build/bin/llama-server -m ./models/DeepSeek-R1-Distill-Qwen-1.5B-Q4_K_M.gguf

在这里插入图片描述

可以看到有28层网络。

三.AI Chat测试

#TODO

没显卡也能跑Deepseek-R1，还等什么，一起体验开源盛会吧

一.先克隆 llama.cpp 仓库并编译（😀用Ubuntu的有福了，有现成的可以直接下载llama-b4686-bin-ubuntu-x64.zip，跳过这步直接去看二）。

步骤

1. 更新系统和安装依赖项

2. 克隆 llama.cpp 仓库

3. 编译 llama.cpp 项目（挺慢的，需耐心等待）

在225行后面添加一行：link_libraries(stdc++fs)

并行构建项目，这台机只有双核，故设置为 2 个并行任务

4. 检查编译结果：

到这一步，这台CentOS 8.5 系统已经可以运行 llama.cpp了，只缺个大模型。

二.安装Deepseek-R1 蒸馏模型

安装huggingface_hub

下载R1-1.5B（qwen2蒸馏）模型文件

跑起来

可以看到有28层网络。

三.AI Chat测试

一.先克隆 `llama.cpp` 仓库并编译（😀用Ubuntu的有福了，有现成的可以直接下载llama-b4686-bin-ubuntu-x64.zip，跳过这步直接去看二）。

2. 克隆 `llama.cpp` 仓库

3. 编译 `llama.cpp` 项目（挺慢的，需耐心等待）

到这一步，这台CentOS 8.5 系统已经可以运行 `llama.cpp`了，只缺个大模型。