ollama轻松拉取huggingface上的大模型

最新推荐文章于 2025-04-03 22:59:34 发布

Ven%

最新推荐文章于 2025-04-03 22:59:34 发布

阅读量4.1k

点赞数 9

分类专栏： ollama动手深度学习基础动手文章标签： ollama 服务器 python 人工智能深度学习自然语言处理

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_51455837/article/details/144230281

版权

深度学习基础动手同时被 2 个专栏收录

36 篇文章

订阅专栏

5 篇文章

订阅专栏

要使用Ollama拉取Hugging Face上的大模型，你可以按照以下步骤操作：

升级Ollama：确保你的Ollama是最新版本，因为新版本支持直接运行Hugging Face上的GGUF格式模型。
找到模型：访问Hugging Face官网，找到你需要的大模型，并记录下模型的网址。
使用镜像站：由于国内网络环境的问题，可能无法直接访问huggingface.co，可以将网址替换为镜像站网址hf-mirror.com，例如将 https://huggingface.co/NexaAIDev/omnivision-968M 替换为 https://hf-mirror.com/NexaAIDev/omnivision-968M。
拉取模型：使用Ollama命令拉取模型，格式为 ollama run hf-mirror.com/{username}/{repository}:{quantization}，其中 {quantization} 是模型的量化版本，如果不写的话默认为 latest，即最新发布的版本。例如，拉取一个名为 omnivision-968M 的模型，命令可以是 ollama run hf-mirror.com/NexaAIDev/omnivision-968M:494M-Q8_0。
指定量化版本：如果需要指定特定的量化版本，可以在模型名后加上冒号和量化方案名称，例如 ollama run hf.co/{username}/{repository}:{quantization}。
运行模型：执行上述命令后，Ollama会检查本地是否有该模型，如果没有，会自动从Hugging Face或镜像站下载，并运行该模型。

请注意，每次运行 ollama run 命令时，Ollama都会尝试从模型库中拉取GGUF模型，这可能会导致空间浪费，因为每次都会重新下载模型。如果你遇到网络连接问题，可以尝试使用代理或者设置镜像源来加速下载。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

Ven% 你的鼓励将是我创作的最大动力！

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。