如何使用阿里开源的通义千问大语言模型

云博士的AI课堂

已于 2024-04-30 19:59:13 修改

阅读量315

点赞数 2

分类专栏：大模型技术开发与实践文章标签：人工智能大模型阿里大模型通义千问 AIGC

于 2024-04-21 21:45:44 首次发布

本文链接：https://blog.csdn.net/l35633/article/details/138046535

版权

大模型技术开发与实践专栏收录该内容

232 篇文章

订阅专栏

Qwen是阿里云开发的大型预训练语言模型，支持聊天和多种语言任务，提供不同规模的模型选项。代码库包含模型实现和示例，适用于聊天、内容生成等AI应用场景。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

地址：

GitHub - QwenLM/Qwen: The official repo of Qwen (通义千问) chat & pretrained large language model proposed by Alibaba Cloud.

中文说明文档：

Qwen/README_CN.md at main · QwenLM/Qwen · GitHub

Qwen 是由阿里巴巴云提出的一个开源的大型预训练语言模型，主要用于聊天和语言任务。该项目的代码库包括了各种模型的实现和示例，支持多种语言和功能。Qwen 模型系列包括从 1.8B 到 72B 参数的模型，涵盖基础语言模型和专门的聊天模型。这些模型在多个基准数据集上展示了优越的性能，适用于多种AI场景，如聊天、内容生成、信息提取、翻译和编程等。

您可以通过这个链接访问 Qwen 的 GitHub 仓库，了解更多详情：Qwen GitHub Repository.