LLM大模型下载方式

最新推荐文章于 2025-04-09 10:35:16 发布

maxmaxma

最新推荐文章于 2025-04-09 10:35:16 发布

阅读量981

点赞数 11

文章标签： LLM

本文链接：https://blog.csdn.net/u010249118/article/details/146388355

版权

以下是几种常用的开源大型语言模型（LLMs）下载方式，结合了官方工具、镜像站及代码库集成方法，供不同需求场景选择：

一、官方途径下载

Hugging Face 原生工具
- 网页直接下载：访问模型主页（如 Qwen2.5-72B 的 HuggingFace 页面），在 "Files and Versions" 中手动下载权重文件。
- 命令行工具 huggingface-cli：
  安装后通过命令直接下载，支持断点续传和指定版本。例如下载 Llama2-70B：
```
huggingface-cli download --resume-download meta-llama/Llama-2-70b-chat-hf --local-dir <路径> 
```
  若需下载量化版本（如 GPTQ/GGUF 格式），可添加 --revision 参数指定分支。
Git 下载
使用 git clone 命令克隆仓库，但需注意此方式不支持断点续传且会包含历史版本，可能占用更多存储空间。

二、镜像站加速（适合国内用户）

HF-Mirror 镜像
- 设置环境变量指向镜像站：
```
$env:HF_ENDPOINT = "https://hf-mirror.com" 
```
- 使用 huggingface-cli 下载，例如下载 Llama3.1 量化模型：
```
huggingface-cli download lmstudio-community/Meta-Llama-3.1-8B-Instruct-GGUF --include "*.gguf" 
```
  此方法可绕过网络限制，提升下载稳定性。
魔搭社区（ModelScope）
提供中文界面及国内服务器加速，支持直接搜索并下载主流模型（如 Qwen、ChatGLM 等），适合不熟悉命令行的用户。

三、代码库集成加载

通过 transformers 库直接加载模型到本地：

from transformers import AutoModelForCausalLM, AutoTokenizer model = AutoModelForCausalLM.from_pretrained("TinyLlama/TinyLlama-1.1B-Chat-v1.0") tokenizer = AutoTokenizer.from_pretrained("nvidia/Llama3-ChatQA-1.5-70B")

此方式自动缓存模型文件，适合开发者快速集成到项目中。