用 Ollama 打造你的本地 AI 小助手：LLaMA / Mistral 部署全流程

最新推荐文章于 2025-04-23 15:46:44 发布

默语

最新推荐文章于 2025-04-23 15:46:44 发布

阅读量805

点赞数 26

分类专栏： AIGC 文章标签：人工智能 llama

div class=creativecommons h1a href=https://devpress.csdn.net/beijing target=_blankstrong北京城市开发者社区主理人-默语 /strong/a/h1 /div

本文链接：https://blog.csdn.net/qq_42055933/article/details/147378268

版权

AIGC 专栏收录该内容

128 篇文章

订阅专栏

💡 引言：为什么选 Ollama + Open WebUI？

在众多本地部署方式中，Ollama 的优势非常明显：

✅ 一行命令拉模型，开箱即用；
✅ 支持 CPU / GPU，适配能力强；
✅ 自带微调能力，支持 GGUF、LLaMA、Mistral 多种模型格式。

而搭配 Open WebUI，你可以获得近似 ChatGPT 的 Web 聊天界面👇：

工具	作用	特点
Ollama	模型加载 & 推理后端	轻量易用、自动管理模型依赖
Open WebUI	前端 Web 界面	支持多模型、Markdown输出、上下文保存

博主默语带您 Go to New World.
✍ 个人主页—— 默语的博客👦🏻 优秀内容
 《java 面试题大全》
《java 专栏》
《idea技术专区》
《spring boot 技术专区》
《MyBatis从入门到精通》
《23种设计模式》
《经典算法学习》
《spring 学习》
《MYSQL从入门到精通》数据库是开发者必会基础之一~
🍩惟余辈才疏学浅，临摹之作或有不妥之处，还请读者海涵指正。☕🍭
🪁 吾期望此文有资助于尔，即使粗浅难及深广，亦备添少许微薄之助。苟未尽善尽美，敬请批评指正，以资改进。！💻⌨

默语是谁？

大家好，我是默语，别名默语博主，擅长的技术领域包括Java、运维和人工智能。我的技术背景扎实，涵盖了从后端开发到前端框架的各个方面，特别是在Java 性能优化、多线程编程、算法优化等领域有深厚造诣。

目前，我活跃在CSDN、掘金、阿里云和 51CTO等平台，全网拥有超过15万的粉丝，总阅读量超过1400 万。统一 IP 名称为默语或者默语博主。我是 CSDN 博客专家、阿里云专家博主和掘金博客专家，曾获博客专家、优秀社区主理人等多项荣誉，并在 2023 年度博客之星评选中名列前 50。我还是 Java 高级工程师、自媒体博主，北京城市开发者社区的主理人，拥有丰富的项目开发经验和产品设计能力。希望通过我的分享，帮助大家更好地了解和使用各类技术产品，在不断的学习过程中，可以帮助到更多的人，结交更多的朋友.

我的博客内容涵盖广泛，主要分享技术教程、Bug解决方案、开发工具使用、前沿科技资讯、产品评测与使用体验。我特别关注云服务产品评测、AI 产品对比、开发板性能测试以及技术报告，同时也会提供产品优缺点分析、横向对比，并分享技术沙龙与行业大会的参会体验。我的目标是为读者提供有深度、有实用价值的技术洞察与分析。

默语：您的前沿技术领航员

👋 大家好，我是默语！
📱 全网搜索“默语”，即可纵览我在各大平台的知识足迹。

📣 公众号“默语摸鱼”，每周定时推送干货满满的技术长文，从新兴框架的剖析到运维实战的复盘，助您技术进阶之路畅通无阻。

💬 微信端添加好友“Solitudemind”，与我直接交流，不管是项目瓶颈的求助，还是行业趋势的探讨，随时畅所欲言。

📅 最新动态：2025 年 1 月 2 日

快来加入技术社区，一起挖掘技术的无限潜能，携手迈向数字化新征程！

文章目录

💡 引言：为什么选 Ollama + Open WebUI？

默语：您的前沿技术领航员
@[TOC]

🚀《用 Ollama 打造你的本地 AI 小助手：LLaMA / Mistral 部署全流程（附常见报错+解决方案）》
⏳ 摘要：

🛠 正文内容
1️⃣ 安装准备篇
✅ 系统要求 & 环境准备
📦 安装 Ollama
🧰 安装 Open WebUI（推荐 Docker）

2️⃣ 模型部署篇
🎯 支持的主流模型

3️⃣ 常见报错 ⚠️ 与解决方案 ✅
❌ 报错：`Failed to pull model: connection reset by peer`
❌ 报错：`No module named llama_cpp`
❌ 报错：推理失败，提示 GPU 显存不足

4️⃣ 模型优化与自定义部署 🚀
🔧 使用 Ollama 创建自定义模型
💾 支持 GGUF 格式模型（兼容 llama.cpp）

✅ 总结：本地部署也能爽用大模型！
📚 参考资料

🚀《用 Ollama 打造你的本地 AI 小助手：LLaMA / Mistral 部署全流程（附常见报错+解决方案）》

在这里插入图片描述

⏳ 摘要：

最近后台收到很多小伙伴留言问：有没有什么方法可以“离线、本地、不联网”用上类 ChatGPT 的对话能力？🌟
答案当然是：有！用 Ollama + Open WebUI，让你几分钟内在本地跑起来像 ChatGPT 一样的模型，不香吗？

不过部署过程中坑是真的不少，比如：

模型拉不下来？
显卡不支持？
启动就是一堆奇怪的报错？

别慌~这篇文章我会一条条带你踩坑、再把坑填好 🧩
看完就能把 Ollama 和 Open WebUI 的部署思路 + 报错处理方式全！都！拿！下！

🛠 正文内容

1️⃣ 安装准备篇

✅ 系统要求 & 环境准备

条件	说明
操作系统	支持 Windows、macOS、Linux（推荐 WSL2）
显卡	若使用 GPU，推荐 NVIDIA 8GB 显存以上
Docker	用于快速部署 WebUI，记得拉满网络代理

⚠️ 小心：Ollama 虽然支持 CPU，但加载大型模型时速度会非常慢哦 🐌，建议优先尝试 GPU！

📦 安装 Ollama

# macOS 安装
brew install ollama

# Windows / Linux 可参考官网安装包
# https://ollama.com

启动服务：

ollama serve

拉模型试试看：

ollama run llama2

👉 成功后你就能和模型开始聊天了 🎉！

🧰 安装 Open WebUI（推荐 Docker）

docker run -d \
  --name open-webui \
  -p 3000:3000 \
  -e OLLAMA_API_BASE_URL=http://<你的本地IP>:11434 \
  ghcr.io/open-webui/open-webui:main

访问 http://localhost:3000 即可开始使用 ✨

⚠️ 小心：确保 Docker 网络可以访问 Ollama 的服务端口 11434！

2️⃣ 模型部署篇

🎯 支持的主流模型

模型名	优点	推荐用途
`llama2`	Meta出品，支持多语言	通用对话
`mistral`	更轻量，速度更快	知识问答、嵌入场景
`deepseek-coder`	强编码能力	编程助手

使用命令：

ollama run mistral
ollama run llama2

3️⃣ 常见报错 ⚠️ 与解决方案 ✅

❌ 报错：`Failed to pull model: connection reset by peer`

原因： 网络问题，模型下载失败 🚫
解决方案：

✅ 使用科学上网代理工具（Clash/V2Ray）
✅ Ollama 支持代理环境变量：

export HTTP_PROXY=http://127.0.0.1:7890
export HTTPS_PROXY=http://127.0.0.1:7890

⚠️ 小心：部分企业/校园网络可能会直接拦截端口请求！

❌ 报错：`No module named llama_cpp`

原因： Open WebUI 使用 llama.cpp 接口，但未正确安装 Python 依赖
解决方案：

pip install llama-cpp-python

❌ 报错：推理失败，提示 GPU 显存不足

原因： 模型太大了！LLaMA 13B 建议至少 16GB 显存
解决方案：

✅ 使用 7B 或 3B 小模型替代
✅ 指定使用 CPU 模式运行：

OLLAMA_NO_CUDA=1 ollama run llama2

4️⃣ 模型优化与自定义部署 🚀

🔧 使用 Ollama 创建自定义模型

ollama create my-model -f Modelfile

Modelfile 示例内容：

FROM mistral
SYSTEM "You are a helpful assistant."

👉 这样就可以自定义上下文系统提示啦 🪄

💾 支持 GGUF 格式模型（兼容 llama.cpp）

GGUF 是 HuggingFace / llama.cpp 推荐的新格式，兼容性和推理速度更好。

上传模型方式请参考：https://ollama.com/library

✅ 总结：本地部署也能爽用大模型！

🎉 到这里，Ollama + Open WebUI 的本地部署流程你已经拿下啦！
不管你是想要一个 离线版 ChatGPT，还是要把模型用到项目里，Ollama 都是一把好用的“瑞士军刀”。

📌 本地部署三大优势：

🌐 离线运行，隐私安全；
💡 灵活自定义模型，系统指令；
🧩 多前端适配，可集成插件系统。

📚 参考资料

📮 喜欢这篇干货文的朋友，别忘了关注默语博主 ✨
加我微信：Solitudemind

💬 也欢迎留言告诉我你遇到的 bug，我们一起把坑填好 💪～

如对本文内容有任何疑问、建议或意见，请联系作者，作者将尽力回复并改进📓；( 联系微信:Solitudemind )

点击下方名片，加入 IT 技术核心学习团队。一起探索科技的未来，共同成长。

为了让您拥有更好的交互体验，特将这行文字设置为可点击样式：点击下方名片，加入 IT
技术核心学习团队。一起探索科技的未来，共同成长。