Ollama ubuntu多线程推理

汐樂

已于 2024-07-01 14:28:17 修改

阅读量502

点赞数 5

文章标签： ubuntu linux

于 2024-07-01 14:28:01 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_43775794/article/details/140098720

版权

1. Ollama 安装

Ollama官网：Download Ollama on Linuxhttps://ollama.com/download/linux使用命令

curl -fsSL https://ollama.com/install.sh | sh

安装Ollama

2. 重新配置Ollama

安装ollama后，在命令行中输入

ollama list

一般会有如下显示

(base) csk@csk-1:~$ ollama list
NAME               	ID          	SIZE  	MODIFIED

表明现在正在运行Ollama后端，但里面没有模型。

默认运行的后端默认线程为1，无法开启多线程，可以输入如下命令，关闭默认后台

systemctl stop ollama

然后在任意目录下新建ollama_serve.sh文件，填入如下命令

OLLAMA_NUM_PARALLEL=2 OLLAMA_MAX_LOADED_MODELS=1 OLLAMA_MODELS=/path_you_want ollama serve

其中OLLAMA_NUM_PARALLEL控制后端可用最大线程数

OLLAMA_MAX_LOADED_MODELS控制ollama后端最大部署模型数量（同时部署多种模型）

OLLAMA_MODELS控制开启服务后模型下载位置

如果想要修改模型存储位置也可以参考这篇文章

Ollama模型下载路径替换！靠谱！（Linux版本）-CSDN博客

4090可以开启16的并发线程以至于不过多影响推理运行速度，具体情况具体调整。

3. 拉取模型

开启ollama服务后，可以直接使用ollama的命令从官网下载模型

可用llama3模型见官网

https://ollama.com/library/llama3

这里我使用的是llama3:8b-text-fp16，在终端输入

ollama pull llama3:8b-text-fp16

自动拉取模型

4. 在终端对话

在终端输入

ollama run llama3:8b-text-fp16

即可在终端与llama3对话

参考网址

ollama官网: https://ollama.com/

ollama Git: https://github.com/ollama/ollama

关注

5
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
Ollama ubuntu多线程推理

默认运行的后端默认线程为1，无法开启多线程，可以输入如下命令，关闭默认后台。然后在任意目录下新建ollama_serve.sh文件，填入如下命令。开启ollama服务后，可以直接使用ollama的命令从官网下载模型。Ollama官网：Download Ollama on Linux。这里我使用的是llama3:8b-text-fp16，在终端输入。控制ollama后端最大部署模型数量（同时部署多种模型）表明现在正在运行Ollama后端，但里面没有模型。安装ollama后，在命令行中输入。
复制链接

扫一扫

汐樂 CSDN认证博客专家 CSDN认证企业博客

码龄6年

2: 原创

130万+: 周排名

16万+: 总排名

9495: 访问

: 等级

38: 积分

13: 粉丝

14: 获赞

4: 评论

99: 收藏

私信

关注

热门文章

最新评论

【Ubuntu 20.04安装和深度学习环境搭建 4090显卡】
GREEN_BIRDOVO: 其他的显卡也可以使用相同的方法进行操作吗{刚刚进入社区，小白一枚}
【Ubuntu 20.04安装和深度学习环境搭建 4090显卡】
星辰同学wwq: 你那写安装cudnn的部分路径名写错了吧，开头应该是cudnn，你写成cuda了： sudo cp cuda/include/cudnn.h /usr/local/cuda/include/ sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64/ sudo chmod a+r /usr/local/cuda/include/cudnn.h sudo chmod a+r /usr/local/cuda/lib64/libcudnn*
【Ubuntu 20.04安装和深度学习环境搭建 4090显卡】
星辰同学wwq: 你那sudo cp cuda/include/cudnn.h /usr/local/cuda/include/ 写错了，少写了个*星号，应该是sudo cp cuda/include/cudnn*.h /usr/local/cuda/include/
【Ubuntu 20.04安装和深度学习环境搭建 4090显卡】
CSDN-Ada助手: 恭喜你开始博客创作！标题中提到的Ubuntu 20.04安装和深度学习环境搭建是一个非常有价值的主题。我相信你的经验和分享将对那些对深度学习感兴趣的读者非常有帮助。接下来，我建议你可以进一步详细介绍在Ubuntu 20.04上搭建深度学习环境的步骤和注意事项，或者分享一些实际应用案例来帮助读者更好地理解和运用这些知识。期待看到你更多的博客作品！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

【Ubuntu 20.04安装和深度学习环境搭建 4090显卡】

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。