方案一：解决huggingface镜像下载限制，搭建本地镜像缓存服务器

最新推荐文章于 2025-05-06 12:42:21 发布

Funhpc_huachen

最新推荐文章于 2025-05-06 12:42:21 发布

阅读量1.4k

点赞数 11

文章标签：服务器运维

本文链接：https://blog.csdn.net/NTD_huachen/article/details/141815324

版权

1. 准备环境

硬件需求

一台服务器，建议使用大容量硬盘以存储模型文件，具体大小取决于需要缓存的模型数量。
推荐使用Ubuntu 20.04或22.04，服务器配置根据需要选择，但要确保有足够的存储空间和网络带宽。

软件需求

Python 3.8+：用于运行服务。
Docker（可选）：可以通过容器化来简化管理。
Nginx/Apache：作为静态文件服务器，用于提供模型文件下载。
Hugging Face Hub CLI：用于从 Hugging Face 拉取模型。

2. 搭建镜像服务器

2.1 使用 Python HTTP Server 快速搭建

如果你希望快速搭建一个本地镜像服务器，可以通过 Python 自带的 HTTP Server 来托管本地缓存的模型文件。

1.创建一个模型缓存目录：

mkdir -p /mnt/model_cache

2.下载 Hugging Face 模型并存放到缓存目录： 可以手动下载 Hugging Face 上的模型，并将其存放在指定目录中，或通过代码自动下载：

from transformers import AutoModel

model_name = "bert-base-uncased"
model = AutoModel.from_pretrained(model_name, cache_dir="/mnt/model_cache")

3.启动 Python HTTP Server： 进入缓存目录，并启动一个简单的HTTP服务：

cd /mnt/model_cache
python3 -m http.server 8000

这将在服务器的 8000 端口启动一个简单的 HTTP 服务器，其他局域网内的机器可以通过 http://<服务器IP>:8000 访问缓存的模型文件。

2.2 使用 Nginx 搭建高效静态文件服务器

1.安装 Nginx：

sudo apt update
sudo apt install nginx

2.配置 Nginx： 创建一个用于模型缓存的虚拟主机配置文件：

sudo nano /etc/nginx/sites-available/model_cache

添加以下内容来配置一个静态文件服务器：

server {
listen 80;
server_name <your-server-ip>;

location / {
root /mnt/model_cache;
autoindex on;
}
}

3.启用配置： 启用并重启 Nginx：

sudo ln -s /etc/nginx/sites-available/model_cache /etc/nginx/sites-enabled/
sudo systemctl restart nginx

现在，Nginx 将会托管 /mnt/model_cache 目录中的文件，其他机器可以通过 http://<服务器IP>/ 访问这些模型。

3. 缓存 Hugging Face 模型

为了避免每次从 Hugging Face 重新下载，可以提前下载常用模型，并配置所有机器通过内部服务器访问。

1.下载模型： 通过 Hugging Face 的transformers库将模型文件下载到本地服务器：

from transformers import AutoModel

model_name = "bert-base-uncased"
model = AutoModel.from_pretrained(model_name, cache_dir="/mnt/model_cache")

这个命令会将模型文件下载到 /mnt/model_cache，并保存在内部镜像服务器中。

2.在客户端配置缓存路径： 客户端可以将模型下载指向镜像服务器，而不是直接从 Hugging Face 获取。修改客户端代码中的from_pretrained方法，指向内部服务器：

from transformers import AutoModel

model_name = "bert-base-uncased"
model = AutoModel.from_pretrained(f"http://<服务器IP>/{model_name}")

这样，所有的客户端将会从内部镜像服务器获取模型，而不是直接访问 Hugging Face。

4. 定期更新模型

你可以定期更新服务器上的缓存模型，以保证缓存文件是最新版本。通过简单的脚本可以实现自动更新：

创建更新脚本： 编写一个脚本来定期检查 Hugging Face 上的模型更新，并下载最新的模型：

#!/bin/bash
model_name="bert-base-uncased"
python3 -c "from transformers import AutoModel; AutoModel.from_pretrained('${model_name}', cache_dir='/mnt/model_cache')"

设置定时任务（cron）自动更新： 使用 cron 设置定期更新：

crontab -e

添加如下条目（每天凌晨2点自动更新）：

0 2 * * * /path/to/your/script.sh

5. 使用 Docker 容器化镜像服务器（可选）

为了便于管理和部署，可以将整个镜像服务器容器化：

编写 Dockerfile：

FROM nginx:latest
COPY ./model_cache /usr/share/nginx/html

构建 Docker 镜像：
```
docker build -t model-mirror .
```
运行容器：
```
docker run -d -p 80:80 model-mirror
```
通过搭建一个内部镜像服务器，可以显著减少对外部资源的依赖，避免因网络问题或下载限制影响模型的使用。无论是通过简单的 Python HTTP Server 还是高效的 Nginx 配置，内部镜像服务器都能帮助更高效地管理和访问 Hugging Face 等平台上的大模型。