【自然语言处理与大模型】Ollama拉取huggingface社区或modelscope社区的GGUF模型并部署

小oo呆

已于 2025-04-25 05:21:52 修改

阅读量1k

点赞数 7

分类专栏：【自然语言处理与大模型】【学习心得】文章标签：自然语言处理人工智能 python

于 2024-12-17 03:46:09 首次发布

本文链接：https://blog.csdn.net/qq_39780701/article/details/144522063

版权

huggingface社区和魔塔社区上的gguf模型现在都支持了ollama部署模型。本文做一个简单的使用总结，详细的官方文档我放在文末。

一、快速使用命令

（1）huggingface

ollama拉取并部署gguf模型命令

# hf.co是huggingface社区
# username/repository是模型在社区的路径
ollama run hf.co/{username}/{repository}

国内用户可以将hf.co改成hf-mirror.com

ollama run hf-mirror.com/{username}/{repository}

拉取带量化的gguf模型

# 命令
ollama run hf.co/{username}/{repository}:{quantization}
# 以千问模型为例
ollama run hf.co/Qwen/Qwen2.5-1.5B-Instruct-GGUF:Q2_K

实际跑一下命令，发现huggingface社区拉取GGUF模型巨慢无比！

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

小oo呆

关注关注

7
点赞
踩
13

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

ollama竟然可以直接加载huggingface上的gguf格式的模型？还支持通过镜像网站对下载过程加速？

xiezhipu的博客

02-27

405

当开发者们还在为模型部署的复杂流程焦头烂额时，Ollama在2024年10月的史诗级更新彻底改写了游戏规则。这个被称为"AI界的Docker"的工具，不仅实现了对HuggingFace Hub上45,000+个GGUF格式模型的一键加载，还贴心地为中国开发者打通了镜像加速通道。本文将深度解析这项技术突破的底层逻辑，并手把手教你玩转这两个革命性功能。SYSTEM "你是一个专业的中文法律顾问"

从零到一教会你ollama大模型本地部署与应用，老师都说写得好！

最新发布

weixin_47006778的博客

05-06

1423

参与评论您还未登录，请先登录后发表或查看评论

使用Ollama配置本地微调的gguf模型文件

weixin_43217276的博客

07-30

3488

在之前的文章中，我们已经得到了经过我们微调的大语言模型，不管是在本地部署使用或者是用OpenWebUI界面部署在服务器上达到和chatGPT界面类似的效果，使用Ollama部署一定是最好的选择。以下均为在Ubuntu系统（Linux）上的测试。

【自然语言处理与大模型】Ollama部署本地GGUF模型

qq_39780701的博客

12-17

1599

使用Ollama部署本地GGUF格式的模型。

Ollama一键运行GGUF模型

Gblfy_Blog

03-01

394

Ollama一键运行GGUF模型

TensorFlow相关组件的安装

AAI666666的博客

01-11

2646

TensorFlow相关组件的安装

在Ollama运行HuggingFace下载的模型

Langchain的博客

07-29

5369

本地运行模型我之前都直接使用LM-studio，好用、无脑。本地用足够了。但是放在服务器上才是正道，本地运行无法长时间开启保持运行，而且Ollama推出了并行GPU计算之后可用性大幅提升，可用性很高。今天研究下如何用Ollama如何在本地来使用这些HF的开源模型，后面把它搬到服务器上。

ollama轻松拉取huggingface上的大模型

Ven%的博客

12-04

4195

命令时，Ollama都会尝试从模型库中拉取GGUF模型，这可能会导致空间浪费，因为每次都会重新下载模型。：由于国内网络环境的问题，可能无法直接访问huggingface.co，可以将网址替换为镜像站网址hf-mirror.com，例如将。：执行上述命令后，Ollama会检查本地是否有该模型，如果没有，会自动从Hugging Face或镜像站下载，并运行该模型。：访问Hugging Face官网，找到你需要的大模型，并记录下模型的网址。是模型的量化版本，如果不写的话默认为。，即最新发布的版本。

Ollama 升级！支持一键拉取Huggingface上所有的模型，太方便了！（vLLM、Fastgpt、Dify、多卡推理）

huang9604的博客

12-16

3562

Ollama 之所以出色，是因为它使用了 GGML 格式，这是一种‘轻量版’的大语言模型，以较低精度运行，能够轻松适配普通硬件。这使得在本地系统上运行这些模型变得简单高效，真正为 AI 的广泛应用铺平了道路。

0 大模型本地部署

qq_28611929的博客

01-03

203

首先是Agent（智能体）：大模型应用中的Agent是指基于大型预训练模型开发的智能体，它们能够执行各种复杂的任务，如自然语言处理（NLP）、图像识别、语音处理等。这些Agent通常是通过深度学习框架和大量的数据进行训练，以获得对特定领域问题的理解能力和解决能力。之前对大模型介绍以及微调写了很多，但是没有一个成熟的应用案例以及体系，从现在我们一起开始基于大模型应用学习，如何落地这些大模型。这里简单介绍，后续直接上代码；

ChatGLM-4-9b-chat本地化｜天翼云GPU上vLLM本地部署开源模型完整攻略

08-15

1844

“拥有一个私有化的领先国产开源大模型？本文详细介绍了如何在天翼云GPU上使用vLLM部署ChatGLM-4-9b-chat本地化模型的完整攻略，助您快速上手。”01—vLLM本来打算用ollama在GPU服务器上部署开源模型GLM4，在之前文章有部署教程：《普通电脑也能跑大模型，三步搞定私人AI助手 | LLaMA-3本地部署小白攻略》。后来朋友推荐使用vLLM部署服务来运行GLM4。vLLM是...

Ollama 运行从 ModelScope 下载的 GGUF 格式的模型(DeepSeek 为例)

01-29

4705

Windows 10。

（踩坑日记）Ollama部署本地微调后的GGUF模型

hjy6666hjy的博客

11-20

2072

在这里插入图片描述](https://i-blog.csdnimg.cn/direct/1dac1f9e26c74d31b2ec9df957425997.png。1、创建一个文件夹（或者在原来文件也行，）用于存放GGUF文件和modelfile文件。后面网上找资料发现是modelfile文件命名的问题。后面发现是Modelfile文件命名错误。3、在之前的文件夹中打开终端，输入。4、最后运行一下你的模型。

Linux的Ollama离线部署与各模型gguf文件离线导入

qq_45875033的博客

03-07

1575

curl --location --request POST 'http://127.0.0.1:11434/api/generate' \--header 'Content-Type: application/json' \--data '{"model": "deepseek-14b","stream": false, "prompt": "1加1等于几?修改vi /etc/systemd/system/ollama.service，修改里面的11434。5、修改环境的端口，让外部服务器可以访问。

Ollama 通过GGUF 文件本地运行任何开源大模型

qq_42881308的博客

03-28

8602

3、打开ollama 终端输入：ollama create baichuan2-7b -f Modelflie.txt。1、下载 GGUF --》Hugging Face 里搜索下载（baichuan gguf、qwen gguf）创建一个新的模型文件名字【baichuan2-7b】使用读取 Modelflie.txt 文件。2、下载文件到本地后然后在同目录创建一个 txt 文建。

ollama把huggingface下载下来的模型转换为gguf

abments的博客

05-16

5215

ollama把huggingface下载下来的模型转换为gguf

如何在ollama上运行Hugging Face的大语言模型

qq_49035156的博客

10-19

7700

在这篇博客中，我们将探讨如何在ollama平台上运行Hugging Face的大语言模型。ollama是一个强大的工具，它允许我们轻松地部署和运行大型语言模型。以下是详细的步骤，帮助你从零开始，到成功运行模型。

【自然语言处理与大模型】魔塔社区免费实例中使用ollama快速部署llama3

qq_39780701的博客

11-19

4004

在ModelScope魔塔社区提供的免费实例，使用ollama部署开源llama3模型。

人工智能学习（AI大模型）必须要知道的两个网站 Ollama 和 Hugging Face 文章里含【Ollama 安装部署教程】

Json的知识梦工厂

02-10

1912

概述HuggingFace 是一个知名的开源平台，专注于自然语言处理（NLP）和机器学习领域。它提供了大量预训练的大型语言模型（LLMs），如 GPT-3、BERT 和 RoBERTa，并构建了一个丰富的生态系统，支持模型的微调、评估和部署。HuggingFace 的目标是让开发者和研究人员能够轻松访问和使用这些先进的模型，推动 AI 技术的普及和应用。核心功能与特点预训练模型库：HuggingFace 提供了全球最大的预训练模型库之一，涵盖了 NLP、计算机视觉、语音处理等多个领域。

ollama拉取huggingface模型

03-21

首先，用户提到的引用[1]中提到了Ollama在HuggingFace Hub中使用GGUF模型的方法，以及加载ModelScope模型的集成。这说明用户可能需要通过HuggingFace的模型仓库找到支持的GGUF格式模型，然后使用Ollama进行加载。...