ubuntu下open-webui + ollama本地大模型部署

hello_Byte

于 2024-08-26 00:20:44 发布

阅读量1.1k

点赞数 24

文章标签： ubuntu ollama open-webui LLM 大模型 nvidia docker

本文链接：https://blog.csdn.net/ludaoyi88/article/details/141528835

版权

文章目录

nvidia gpu驱动安装
- 安装
- 卸载
ollama 部署
open-webui 部署

业余兴趣，部署下最近很火的LLM大模型玩玩，现在市面做这种大模型的部署快速应用还是挺多的，比如下面这些。
在这里插入图片描述

这里介绍采用nvidia gpu，基于ubuntu docker环境下的open-webui + ollama本地大模型部署过程。

nvidia gpu驱动安装

如果电脑有nvidia gpu，使用本地大模型最好采用gpu，否则用cpu的推理速度极慢，还占用资源。

安装

# nvidia镜像源
curl -fsSL https://nvidia.github.io/libnvidia-container/gpgkey | sudo gpg --dearmor -o /usr/share/keyrings/nvidia-container-toolkit-keyring.gpg \
  && curl -s -L https://nvidia.github.io/libnvidia-container/stable/deb/nvidia-container-toolkit.list | \
    sed 's#deb https://#deb [signed-by=/usr/share/keyrings/nvidia-container-toolkit-keyring.gpg] https://#g' | \
    sudo tee /etc/apt/sources.list.d/nvidia-container-toolkit.list

apt-get update

#安装 NVIDIA Container Toolkit 软件包
   apt-get install -y nvidia-container-toolkit
#配置 Docker 以使用 Nvidia 驱动程序
   sudo nvidia-ctk runtime configure --runtime=docker

apt-get install dkms

ubuntu-drivers devices # 查询系统建议安装的nvidia版本
apt install nvidia-driver-550-open  #选择驱动版本安装
ls /usr/src/ |grep nvidia #可以看到nvidia开头的驱动版本文件

安装后reboot重启
然后执行nvidia-smi查看gpu情况，确认是否安装成功。

卸载

sudo apt-get --purge remove nvidia*
sudo apt autoremove

# To remove CUDA Toolkit:
sudo apt-get --purge remove "*cublas*" "cuda*"
sudo apt-get --purge remove "*nvidia*"

ollama 部署

添加docker秘钥

curl -fsSL http://mirrors.aliyun.com/docker-ce/linux/ubuntu/gpg | sudo apt-key add -

添加阿里docker软件源

sudo add-apt-repository "deb [arch=amd64] http://mirrors.aliyun.com/docker-ce/linux/ubuntu $(lsb_release -cs) stable"

在这里插入图片描述

docker配置添加国内镜像源

创建文件：/etc/docker/daemon.json，添加如下内容， docker镜像源将会从如下站点拉取。同时配置Nvidia运行时，能在docker中使用GPU。

{
    "registry-mirrors": [  #镜像源
        "https://docker.mirrors.ustc.edu.cn",
        "https://hub-mirror.c.163.com",
        "https://docker.m.daocloud.io",
        "https://ghcr.io",
        "https://mirror.baidubce.com",
        "https://docker.nju.edu.cn"
    ],
    "default-runtime": "nvidia",
	"runtimes": {
	       "nvidia": {
	           "args": [],
	           "path": "nvidia-container-runtime"
	       }
	 },
    "data-root": "/home/docker/data/"  #docker镜像默认安装路径
    
}

其中，"data-root"为docker镜像默认安装路径，用户根据自己情况选择路径。如果不选择，默认安装到：/var/run/docker/。
sudo systemctl restart docker 生效。

ollama安装

从源拉取ollama镜像。

docker pull ollama/ollama:latest

启动一个ollama容器

docker run -d --gpus=all --restart=always -v /root/project/docker/ollama:/root/project/.ollama -p 11434:11434 --name ollama ollama/ollama

使用镜像为ollama/ollama，映射端口11434。

通过ollama下载模型到本地

#下载通义千问：
docker exec -it ollama ollama run qwen2
#下载通义ollama3
docker exec -it ollama ollama run  llama3.1:8b

查看已经安装好的模型：

docker exec -it ollama ollama list

在这里插入图片描述
可下载其他模型库如下，根据自身电脑配置下载

模型	参数数量	大小	下载方式
Llama 2	7B	3.8GB	docker exec -it ollama ollama run llama2
Mistral	7B	4.1GB	docker exec -it ollama ollama run mistral
Dolphin Phi	2.7B	1.6GB	docker exec -it ollama ollama run dolphin-phi
Phi-2	2.7B	1.7GB	docker exec -it ollama ollama run phi
Neural Chat	7B	4.1GB	docker exec -it ollama ollama run neural-chat
Starling	7B	4.1GB	docker exec -it ollama ollama run starling-lm
Code Llama	7B	3.8GB	docker exec -it ollama ollama run codellama
Llama 2 Uncensored	7B	3.8GB	docker exec -it ollama ollama run llama2-uncensored
Llama 2	13B	7.3GB	docker exec -it ollama ollama run llama2:13b
Llama 2	70B	39GB	docker exec -it ollama ollama run llama2:70b
Orca Mini	3B	1.9GB	docker exec -it ollama ollama run orca-mini
Vicuna	7B	3.8GB	docker exec -it ollama ollama run vicuna
LLaVA	7B	4.5GB	docker exec -it ollama ollama run llava
Gemma	2B	1.4GB	docker exec -it ollama ollama run gemma:2b
Gemma	7B	4.8GB	docker exec -it ollama ollama run gemma:7b

检验本地模型

通过命令运行ollama3.1，能直接进行对话，说明正常了。

docker exec -it ollama ollama run  llama3.1:8b

在这里插入图片描述

open-webui 部署

上面命令方式跟模型对话不太通用，通常会做成网页形式交互，这里可以采用open-webui。

安装容器和镜像下载

支持 Nvidia GPU 的 Open WebUI

sudo docker run -d -p 3000:8080 --gpus all --add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:cuda

但下载估计非常慢，可以用国内的：

sudo docker run -d -p 3000:8080 --gpus all --add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data --name open-webui --restart always  registry.cn-shenzhen.aliyuncs.com/funet8/open-webui:cuda

如果不支持 Nvidia GPU 可以下载main版本：

$ sudo docker run -d -p 3000:8080 --add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:main

映射端口号为3000.
查看ollama和open-webui安装的容器和镜像：
在这里插入图片描述