怎么在AutoDL上面使用HuggingFace（亲测有效）

最新推荐文章于 2025-03-27 16:50:47 发布

逐梦苍穹

最新推荐文章于 2025-03-27 16:50:47 发布

阅读量2.1k

点赞数 26

文章标签：人工智能 autodl hugging face

本文链接：https://blog.csdn.net/qq_60735796/article/details/145406385

版权

🍃作者介绍：双非本科大四网络工程专业在读，阿里云专家博主，前三年专注于Java领域学习，擅长web应用开发，目前专注于人工智能领域相关知识🌹
🦅个人主页：@逐梦苍穹(5600粉丝；60万访问量)
✈ 您的一键三连，是我创作的最大动力🌹

前言

先介绍一下二者：

AutoDL是一个算力租赁平台，可以在上面租A100和4090等一众GPU；
HuggingFace是一个开源社区，提供了很多开源模型，同时也提供了很多相关的python库，供开发者更好的训练/微调模型。

那么在AutoDL上使用HuggingFace相关库最大的问题是什么呢，是HuggingFace是国外网站，下载需要科学上网，但是AutoDL是国内的

镜像网站：https://hf-mirror.com/

解决方法有三种，直接参考镜像网站的方法：

在https://hf-mirror.com/搜索，并在模型主页的Files and Version中下载文件

安装依赖：pip install -U huggingface_hub
设置环境变量：
- Linux：export HF_ENDPOINT=https://hf-mirror.com
- Windows Powershell：$env:HF_ENDPOINT = “https://hf-mirror.com”
下载：
- 下载模型： huggingface-cli download --resume-download gpt2 --local-dir gpt2
- 下载数据集：huggingface-cli download --repo-type dataset --resume-download wikitext --local-dir wikitext
- 可以添加 –local-dir-use-symlinks False 参数禁用文件软链接，这样下载路径下所见即所得

hfd 是这个镜像站开发的 huggingface 专用下载工具，基于成熟工具 aria2，可以做到稳定高速下载不断线。

下载hfd：
- wget https://hf-mirror.com/hfd/hfd.sh
- chmod a+x hfd.sh
安装aria2：
- sudo apt update
- sudo apt install aria2
设置环境变量：
- Linux：export HF_ENDPOINT=https://hf-mirror.com
- Windows Powershell：$env:HF_ENDPOINT = “https://hf-mirror.com”
下载：
- 下载模型：./hfd.sh dreamingInTheSky-xzl2211/llama3.1-8B-BilingualTranslation
- 下载数据集：./hfd.sh dreamingInTheSky-xzl2211/BilingualData --dataset