Ollama部署攻略:调优技巧+最优配置=性能巅峰!
上篇文章主要讲了在CentOS 8上如何安装Ollama并运行DeepSeek模型,那么部署是最简单也是最基本的步骤了,在实际应用过程中部署完能用并达不到我们的要求,还必须要对Ollama服务进行配置和参数的配置调整优化来满足用的好的需求。那么下边将介绍一些常用的配置调优。
注:本文调优参数不定时更新,如果有更好的配置欢迎评论批评指正。
一、了解你的环境
GPU环境,使用nvidia-smi,可以看到每个 GPU 的数量、详细信息,包括使用情况、显存、温度等。
[root@T-LLM-DS-01 system]# nvidia-smi
Tue Feb 18 10:44:59 2025
+-----------------------------------------------------------------------------------------+
| NVIDIA-SMI 550.144.03 Driver Version: 550.144.03 CUDA Version: 12.4 |
|-----------------------------------------+------------------------+----------------------+
| GPU Name Persistence-M | Bus-Id Disp.A | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap | Memory-Usage | GPU-Util Compute M. |
| | | MIG M. |
|=========================================+========================+======================|
| 0 NVIDIA A10 Off | 00000000:00:08.0 Off | 0 |
| 0