如何用hugging face hub一键下载模型并将模型转换为gguf格式（支持自定义量化）

申非zz

已于 2024-05-23 11:54:14 修改

阅读量1.1w

点赞数 32

文章标签：人工智能语言模型 python git 机器学习

于 2024-03-24 16:31:32 首次发布

本文链接：https://blog.csdn.net/2301_78453609/article/details/136989524

版权

如何在hugging face hub一键下载模型并将模型转换为gguf格式（支持自定义量化）

作者：申非

第一步：在【hugging face】网站上寻找到支持模型列表中的模型的 相对地址

如：

第二步：克隆llama.cpp并编译

make的安装使用可以看【在windows上安装make - 知乎 (zhihu.com)】。然后使用make编译【llama】

第三步：环境配置

进入本地【E:\llamaapp\llama.cpp】文件夹（llama.cpp文件夹），在当前环境下将【llama】依赖包安装好

pip install -r requirements.txt

并导入【huggingface_hub】

pip install huggingface_hub

如果C盘内存不充足，可以更换缓存地址，即添加系统变量

【HF_HUB_CACHE = ‘你自己设定的缓存地址’】

如：

第四步：在llama.app文件夹下，创建并运行【Hub_download.py】文件，下载模型

结合第一步的相对地址填入参数【model_addr】中

创建Hub_download.py文件代码内容如下：

（更新）目前需要加入login()用access tokens登录才可以获取模型下载权限。token获取可以参考：仓库申请报错：Cannot access gated repo for url https://huggingface.co/api-CSDN博客



from huggingface_hub import snapshot_download

from huggingface_hub import login

#目前需要输入access token确认登陆
huggingface_hub.login("在这里输入你的access token")

#自行选择模型，自行修改下面参数（第一步的相对地址）
model_addr = 'Qwen/Qwen1.5-1.8B-Chat'

#提取模型库名和模型名称
model_repo = model_addr.split('/')[0]
model_name = model_addr.split('/')[1]

# 下载模型
snapshot_download(
repo_id=f"{model_addr}",

#去除tensorflow的模型，只下载pytorch模型
ignore_patterns=["*.h5", "*.ot", "*.msgpack"],

#模型存储地址
local_dir=f"E:\\llamaapp\\llama.cpp\\models\\{model_repo}\\{model_name}",
)

然后在llama.app文件夹的【cmd】下执行命令：python Hub_download.py

如果有其他需求可以自行修改该上面Hub_download.py文件内容。（参考hub官方文档：Manage your Space (huggingface.co)）

运行结果：