大模型本地化部署（Ollama + Open-WebUI）

最新推荐文章于 2025-05-06 09:04:52 发布

今朝无言

最新推荐文章于 2025-05-06 09:04:52 发布

阅读量1.4w

点赞数 24

分类专栏：大模型文章标签： ai 语言模型

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_43557686/article/details/145404771

版权

大模型专栏收录该内容

1 篇文章

订阅专栏

文章目录

环境准备
本地化部署的Web图形化界面
本地模型联网查询

环境准备

下载Ollama

下载地址：Ollama网址

安装完成后，命令行里执行命令

ollama -v

查看是否安装成功。安装成功会显示版本信息

在这里插入图片描述

ollama 的命令可通过 ollama -h 查看。

模型下载

可以在 Ollama 网站的 Models 里查看公开的大模型（网址），也可以从大模型镜像源站 HF-Mirror 下载。

以 Ollama 网站为例，点进一个大模型（如最近大火的 DeepSeek R1）

在这里插入图片描述

如图右下角的 ollama run deepseek-r1 就是下载命令，在第一次执行该命令时，ollama 将从网站下载大模型，在下载完成后，再执行这一命令就会加载模型，并进入交互模式：

在这里插入图片描述

注：大部分模型都是有内容审查的，这很多时候限制了我们的使用灵活性，可以寻找带有 abliterated 后缀的模型，这些模型被注释了审查代码。（不过本人尝试发现 abliterated 版本的实际上仍存在审查机制，会拒绝回答某些问题）

下载Open-WebUI

网上其他教程安装 Open-WebUI 一般都是在虚拟机 Docker 下安装的，这在 Windows 系统里很不方便。这里提供另外一种方法：首先安装 Python 3.11，然后在命令行里执行

pip install open-webui

即可完成 open-webui 的安装。

本地化部署的Web图形化界面

首先，需要开启 Ollama 服务，运行一个大模型，在命令行里执行

ollama run 大模型名

其中模型名可以通过 ollama list 查看。启用 ollama 服务后，可以使用

ollama ps

命令查看当前运行的模型进程。

随后再打开一个命令行，执行如下命令启用 open-webui 服务

open-webui serve

启动后可以在浏览器里输入以下地址，打开 Web 图形化界面：

localhost:8080
(本机IP):8080

其中第二个地址可以在局域网内的其他设备访问。

Open-WebUI 的界面如下

在这里插入图片描述

本地化部署完成！

本地模型联网查询

未联网的情况下，很多问题大模型无法解决，回答也比较蠢（还会胡说），因此需要增加联网查询功能。

安装 Docker

安装 Docker Desktop 即可（网址 Docker）。安装后用以下命令查询是否安装完成：

docker -v

安装 SearXNG

执行如下命令拉取 SearXNG （一个可以本地部署的轻量化搜索引擎）

docker pull searxng/searxng

不过这个命令由于网站无法连接，下载往往失败，可以使用镜像源：

docker pull docker.m.daocloud.io/searxng/searxng

安装完成后即可在 Docker Desktop 里查看到 SearXNG Image：

在这里插入图片描述

执行如下命令（最后面一串是 Image Name，注意要和你的 SearXNG 名字相同），将服务开在了端口 12345

docker run -d -p 12345:8080 docker.m.daocloud.io/searxng/searxng

随后可以在 Docker Desktop 的 Container/App 界面查看到运行的 SearXNG，显示运行在 12345 号端口。在命令行里使用

docker ps

命令也可以查看到运行中的 docker 镜像进程。

在浏览器访问 localhost:12345，可以看到 SearXNG 服务已开启。

在这里插入图片描述

用默认配置的 SearXNG 很可能搜索不到东西，可以在配置里修改搜索引擎，改成大陆可以访问的那几个。

本地模型联网查询

在 open-webui 界面下，用户->管理员面板->设置里面，配置搜索引擎如下，并保存设置

在这里插入图片描述

此时询问问题，联网查询可能会报 403 错误，需要修改一个配置文件。执行

docker ps

查看 searxng 服务的 CONTAINER ID 号，随后执行以下命令（命令中的 <CONTAINER_ID> 替换为你 SearXNG 的 CONTAINER ID）

docker exec -it <CONTAINER_ID> sh

进入到镜像目录，随后进入 /etc/searxng/ 目录，使用 vi 修改 settings.yml 文件，在 formats 下面增加一行（- json）

在这里插入图片描述

修改文件后保存，然后 restart 容器。

修改 settings.yml 后，open-webui 联网查询不再报 403 错误，但可能报 Expecting value: line 1 column 1 (char 0) 错误（这是因为返回值格式不满足 json 格式导致的解析错误）或 RemoteDisconnected('Remote end closed connection without response') 错误，笔者目前还没有找到好的解决方法，日后若解决了再补上这里。

(U•ェ•*U )

博客等级

码龄7年

54
原创

572
点赞

2822
收藏

1万+
粉丝

关注

私信

热门文章

分类专栏

大模型 1篇
数字逻辑 36篇
算法 7篇
数学 6篇
Ethernet 5篇
原理图&PCB 1篇
matlab 1篇
嵌入式 9篇
天线&前端 1篇
开关电源 1篇
Altium Designer 1篇

展开全部收起

最新评论

RTL8211FSI PHY电路设计
weixin_45376789: 大佬这个硬件和软件都是自己设计和调试的么
TEMAC配置及三速自协商环回测试
今朝无言: AXI-Stream协议是通过tlast信号标记一帧的结束的，所以为了方便设计，FIFO一般也使用AXI-Stream接口形式的；这个FIFO接口形式在Vivado的IP设置中可以选择是常规接口还是AXI-Stream接口
TEMAC配置及三速自协商环回测试
站在洗衣机上看冰箱: 好的，十分感谢。再麻烦问一下这个ip核在rx_stream端没有接收ready信号，那么如何跟fifo实现握手呢
NMEA(xxGGA)报文解析(FPGA实现)
gongyonghao: 同问，我现在也是不知道解析模块后的一堆输出hh这些怎么作为输入传给最后的tx模块
TEMAC配置及三速自协商环回测试
今朝无言: 是的，这个TEMAC只是MAC层的控制器，需要由上层进行IP和UDP协议的封装，然后把组装后的MAC帧发送到这个IP核

最新文章

目录

展开全部

收起

评论 3

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

今朝无言 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。