hugging face 上模型文件自动下载方法札记

最新推荐文章于 2024-05-16 16:20:21 发布

magic_road

最新推荐文章于 2024-05-16 16:20:21 发布

阅读量448

点赞数 1

文章标签：数据库 python 人工智能语言模型

本文链接：https://blog.csdn.net/magic_road/article/details/134122991

版权

最近需要需要下载大模型，因为模型文件比较多，一个个手动下载很繁琐，所以就百度了一下hugging face上模型自动下载的脚本写法，今天终于解决了模型下载总是会出现中断的原因：

#!/usr/bin/env python
# -*- coding: UTF-8 -*-

from huggingface_hub import snapshot_download

repo_id = "BAAI/bge-large-zh"  # 模型在huggingface上的名称
local_dir = f"models/base/{repo_id.split('/')[-1]}"  # 本地模型存储的地址
local_dir_use_symlinks = False  # 本地模型使用文件保存，而非blob形式保存

# 注意：“在hugging face上生成的 自己的access token， 否则模型下载会中断”
token = "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" # 这里需要自己替换，我这个是fake demo

# 开始下载
snapshot_download(
    repo_id=repo_id,
    local_dir=local_dir,
    local_dir_use_symlinks=local_dir_use_symlinks,
    token=token,
)

repo_id 是什么？看下图；