阿里通义千问Qwen1.5开源震撼发布，6种参数小至0.5B，性能超越GPT3.5

最新推荐文章于 2024-11-05 22:30:00 发布

努力犯错

最新推荐文章于 2024-11-05 22:30:00 发布

阅读量2.5k

点赞数 25

文章标签： gpt-3 人工智能深度学习 llama 算法自然语言处理

本文链接：https://blog.csdn.net/nulifancuoAI/article/details/136062913

版权

阿里巴巴推出最新大模型Qwen1.5，包含多种规模和类型的模型，提升多语言能力、人类偏好对齐及长序列处理能力。开源设计简化开发者使用，与HuggingFace深度集成，预示AI技术新篇章的到来。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

在人工智能技术快速发展的今天，阿里巴巴再次引领潮流，推出了最新的大模型——通义千问Qwen1.5。此次更新不仅提供了覆盖从0.5B到72B不同规模的模型，而且还开源了包括Base和Chat模型在内的多种版本，为全球开发者带来了前所未有的便利和机遇。

Qwen1.5系列模型包括0.5B、1.8B、4B、7B、14B和72B六种规模，涵盖了Base和Chat两种类型。此外，阿里巴巴还特别提供了Int4、Int8的GPTQ模型，以及AWQ和GGUF量化模型，力求在保证模型性能的同时，进一步降低模型部署的成本和门槛。

在性能评测方面，Qwen1.5在多项基准测试中均展现出优异的性能。无论是在语言理解、代码生成、推理能力，还是在多语言处理和人类偏好对齐等方面，Qwen1.5系列模型均表现出了强大的竞争力。

基础能力评估：在MMLU、C-Eval、Humaneval等多个基准数据集上，Qwen1.5系列模型与业界顶尖模型如GPT-3.5、Llama2等相比，展示了卓越的性能。

阿里巴巴将Qwen1.5的代码正式合并到Hugging Face transformers代码库中，极大地简化了模型的使用流程。现在，开发者可以直接使用transformers>=4.37.0原生代码，而无需指定trust_remote_code选项即可开发和部署。

此外，Qwen1.5还与vLLM、SGLang、AutoAWQ、AutoGPTQ等框架进行了深度集成，支持了从模型训练到部署的全流程，进一步提升了开发者的使用体验。

阿里巴巴通义千问Qwen1.5的开源震撼发布，不仅展示了在AI领域的强大实力和创新能力，也为全球的开发者和研究者提供了一个强大的平台，共同探索人工智能的未来。随着Qwen1.5系列模型的广泛应用和进一步发展，我们有理由相信，它将为人工智能技术的发展和应用开启新的篇章，带来更多的可能性和惊喜。

阿里通义千问Qwen1.5的开源不仅在技术层面展示了阿里巴巴在AI领域的强大实力，更在文化层面彰显了开源共享、合作共赢的精神。这次发布，既是对模型质量的一小步提升，也是对开发者体验的一大步优化，期待Qwen1.5能在您的研究或应用项目中发挥重要作用，共同推动AI技术的进步与发展。

Huggingface模型下载

https://huggingface.co/Qwen

AI快站模型免费加速下载

https://aifasthub.com/models/Qwen