Ollama高效、功能齐全的LLM大模型服务工具——只需一条命令即可在本地跑语言大模型

最新推荐文章于 2025-03-25 11:14:16 发布

CloverZhou,2024

最新推荐文章于 2025-03-25 11:14:16 发布

阅读量1.2w

点赞数 24

分类专栏：人工智能文章标签： llama 人工智能 pytorch 语言模型 transformer nlp windows

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/CloverZhouXinyu/article/details/136395972

版权

人工智能专栏收录该内容

2 篇文章

订阅专栏

零. 引言

什么是Ollama：

Ollama是一个开源的大型语言模型服务工具，它帮助用户快速在本地运行大模型，通过简单的安装指令，可以让用户执行一条命令就在本地运行开源大型语言模型，例如 Llama2。这个框架简化了在Docker容器内部署和管理LLM的过程，使得用户能够快速地在本地运行大型语言模型。
Ollama 将模型权重、配置和数据捆绑到一个包中，定义成 Modelfile。它优化了设置和配置细节，包括 GPU 使用情况。

Ollama的优势：

①易于使用：Ollama提供了一个简单的API，使得即使是没有经验的用户也可以轻松使用。此外，它还提供了类似ChatGPT的聊天界面，用户无需开发即可直接与模型进行聊天交互。
②轻量级：Ollama的代码简洁明了，运行时占用资源少。这使得它能够在本地高效地运行，不需要大量的计算资源。
③可扩展：Ollama支持多种模型架构，并可以扩展以支持新的模型。它还支持热加载模型文件，无需重新启动即可切换不同的模型，这使得它非常灵活多变。
④预构建模型库：Ollama提供了一个预构建模型库，可以用于各种任务，如文本生成、翻译、问答等。这使得在本地运行大型语言模型变得更加容易和方便。

一. 下载 Ollama 安装文件

访问 https://ollama.com/download，选择 Windows，单击 “Download for Windows (Preview)” 进行下载。

二. 安装 Ollama

双击下载的 “OllamaSetup.exe”，进行安装。

三. 环境变量

Ollama 下载的模型默认保存在 C 盘。
强烈建议更改默认路径，可以通过新建环境变量 OLLAMA_MODELS 进行修改。

OLLAMA_MODELS
E:\OllamaCache

设置成功后重启电脑生效修改

四. 使用 Ollama

访问 https://ollama.com/library，搜索需要使用的模型，主流的模型。

记得先启动Ollma,确保Ollma在任务栏

再下面以 qwen-7b 为例，选择运行 7b 的模型，

拷贝上面红框的命令并在cmd或者PowerShell运行(推荐使用cmd)，

ollama run qwen:7b

等待模型下载与加载，目前前95%下载速度快，99%到100%速度较慢。
当出现 Send a nessage 即可开始模型的使用

qwen-7b效果图：

ollama run qwen:7b

orion14b-q4效果图：

ollama run orionstar/orion14b-q4

llama2-chinese效果图：

ollama run llama2-chinese

网络上搜集的问题与回答：

五. 再次使用

确保Ollama正常运行后，
在cmd输入运行代码即可免下载安装直接使用（已在第4步模型安装成功）
如：

ollama run llama2-chinese

六. 结语

本人使用的是8GB-2070super,16GB内存，i7-10700K。
在运行qwen-7b和llama2-chinese相当流畅，直接反馈出回复。

CloverZhou,2024

博客等级

码龄4年

2
原创

239
点赞

213
收藏

142
粉丝

关注

私信

热门文章

分类专栏

人工智能 2篇

展开全部收起

最新评论

Ollama高效、功能齐全的LLM大模型服务工具——只需一条命令即可在本地跑语言大模型
CloverZhou,2024: 我的ollama在家庭网络和公司网络都是满速下载的。实在不行放后台慢慢下载吧。
Ollama高效、功能齐全的LLM大模型服务工具——只需一条命令即可在本地跑语言大模型
字节跳动前端组: 下载好慢，请问用什么加速的
Ollama高效、功能齐全的LLM大模型服务工具——只需一条命令即可在本地跑语言大模型
CloverZhou,2024: 在“/etc/systemd/system/ollama.service”新增2行: Environment="OLLAMA_HOST=0.0.0.0" Environment="OLLAMA_MODELS=/app/models/ollama" 然后 sudo systemctl status ollama.service 这样就可以确保Ollama API能被访问改好之后IP应该是：http://192.168.1.16:11434 OneAPI 有专门的Ollama渠道模型名字就填从Ollama上pull的模型名称
Ollama高效、功能齐全的LLM大模型服务工具——只需一条命令即可在本地跑语言大模型
码中之云: 请问部署完之后，如何开放接口给AIGC应用调用呢？
Ollama高效、功能齐全的LLM大模型服务工具——只需一条命令即可在本地跑语言大模型
CSDN-Ada助手: 恭喜你开始了博客创作，标题看起来很吸引人！希望你能继续分享更多关于Ollama和其他工具的使用经验，让更多人受益。同时，也建议你可以在博客中加入一些实际的案例分析或者使用技巧，这样读者可以更好地理解和运用这些工具。期待你的下一篇文章！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1

最新文章

ChatGLM3 多轮推理报错解决方案——AttributeError: can’t set attribute ‘eos_token’

目录

展开全部

收起

评论 7

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。