Ollama部署攻略：调优技巧+最优配置=性能巅峰！

最新推荐文章于 2025-04-17 21:33:31 发布

Energet!c

最新推荐文章于 2025-04-17 21:33:31 发布

阅读量1w

点赞数 14

文章标签： linux ai 语言模型

本文链接：https://blog.csdn.net/qq_32014795/article/details/145699927

版权

Ollama部署攻略：调优技巧+最优配置=性能巅峰！

一、了解你的环境
二、了解可配置的参数
- Ollama参数
- 其他环境变量
三、参考配置

上篇文章主要讲了在CentOS 8上如何安装Ollama并运行DeepSeek模型，那么部署是最简单也是最基本的步骤了，在实际应用过程中部署完能用并达不到我们的要求，还必须要对Ollama服务进行配置和参数的配置调整优化来满足用的好的需求。那么下边将介绍一些常用的配置调优。

注：本文调优参数不定时更新，如果有更好的配置欢迎评论批评指正。

一、了解你的环境

GPU环境，使用nvidia-smi，可以看到每个 GPU 的数量、详细信息，包括使用情况、显存、温度等。

[root@T-LLM-DS-01 system]# nvidia-smi 
Tue Feb 18 10:44:59 2025       
+-----------------------------------------------------------------------------------------+
| NVIDIA-SMI 550.144.03             Driver Version: 550.144.03     CUDA Version: 12.4     |
|-----------------------------------------+------------------------+----------------------+
| GPU  Name                 Persistence-M | Bus-Id          Disp.A | Volatile Uncorr. ECC |
| Fan  Temp   Perf          Pwr:Usage/Cap |           Memory-Usage | GPU-Util  Compute M. |
|                                         |                        |               MIG M. |
|=========================================+========================+======================|
|   0  NVIDIA A10                     Off |   00000000:00:08.0 Off |                    0 |
|  0