《Qwen-72B的实战教程：从入门到精通》

最新推荐文章于 2025-04-10 15:30:16 发布

莫奔列Pearl

最新推荐文章于 2025-04-10 15:30:16 发布

阅读量521

点赞数 18

本文链接：https://blog.csdn.net/gitblog_02246/article/details/144741394

版权

《Qwen-72B的实战教程：从入门到精通》

Qwen-72B 项目地址: https://gitcode.com/hf_mirrors/ai-gitcode/Qwen-72B

引言

欢迎来到Qwen-72B的实战教程！本教程旨在帮助您深入了解并掌握Qwen-72B模型的使用，从基础环境搭建到高级应用，全方位提升您的大语言模型应用能力。教程分为四个部分，逐步引导您从入门到精通。

基础篇

模型简介

Qwen-72B是阿里云推出的720亿参数的大语言模型，基于Transformer架构，经过大规模数据预训练。它不仅在中英两种语言上表现出色，还具备处理多种语言和代码的能力。Qwen-72B的强大性能使其在多个基准数据集上超越了现有的开源模型。

环境搭建

在开始使用Qwen-72B之前，您需要准备以下环境：

Python 3.8及以上版本
PyTorch 1.12及以上版本，推荐2.0及以上版本
CUDA 11.4及以上版本（针对GPU用户）

安装必要的依赖库：

pip install transformers==4.32.0 accelerate tiktoken einops scipy transformers_stream_generator==0.0.4 peft deepspeed

简单实例

下面是一个简单的Qwen-72B模型调用实例：

from transformers import AutoModelForCausalLM, AutoTokenizer

tokenizer = AutoTokenizer.from_pretrained("Qwen/Qwen-72B", trust_remote_code=True)
model = AutoModelForCausalLM.from_pretrained("Qwen/Qwen-72B", device_map="auto", trust_remote_code=True).eval()

inputs = tokenizer('蒙古国的首都是乌兰巴托（Ulaanbaatar）\n冰岛的首都是雷克雅未克（Reykjavik）\n埃塞俄比亚的首都是', return_tensors='pt')
inputs = inputs.to(model.device)
pred = model.generate(**inputs)
print(tokenizer.decode(pred.cpu()[0], skip_special_tokens=True))