一分钟搞定:使用脚本从HuggingFace镜像站下载模型或数据集

一分钟搞定:使用脚本从HuggingFace镜像站下载模型或数据集

为什么要脚本下载? 在模型训练和部署中,往往会遇到访问HF超时的问题。因此我们常常会提前将模型权重或数据集下载到本地。但相关文件往往比较多,在网页上手动下载太过繁琐。一个一键下载指定HF仓库的脚本就非常实用。
在这里插入图片描述
这里介绍官网提供的下载方法之一:huggingface-cli

两步搞定:

1. 命令行安装huggingface-cli:

pip install -U huggingface_hub

2. 创建python脚本如下:

import os

# 设置环境变量
os.environ['HF_ENDPOINT'] = 'https://hf-mirror.com'

# 下载模型
os.system('huggingface-cli download --resume-download HF上的模型名称 --local-dir 本地存放路径')

# 下载数据集
os.system('huggingface-cli download --repo-type dataset --resume-download HF上的数据集名称 --local-dir 本地存放路径')

HF上的模型名称获取方式如下:
在这里插入图片描述
python运行该脚本即可

显示没权限怎么办

有时仓库所有者设定了权限,因此直接上述下载会报权限错误。解决方法为,调整脚本,增加令牌参数 --token,这是一个类似口令的验证码:

import os

# 设置环境变量
os.environ['HF_ENDPOINT'] = 'https://hf-mirror.com'

# 下载模型
os.system('huggingface-cli download --resume-download HF上的模型名称 --local-dir 本地存放路径 --token XXXX')

如何获取口令呢?详见这里末尾的常见问题。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值