实力超ChatGPT-4！阿里Qwen1.5上线！

最新推荐文章于 2024-06-06 23:07:44 发布

智言AI

最新推荐文章于 2024-06-06 23:07:44 发布

阅读量425

点赞数 10

分类专栏：云原生 AI ChatGPT 文章标签：人工智能 chatgpt gpt midjourney ai

本文链接：https://blog.csdn.net/qq_26402269/article/details/137478706

版权

云原生同时被 3 个专栏收录

1 篇文章 0 订阅

订阅专栏

1 篇文章 0 订阅

订阅专栏

ChatGPT

1 篇文章 0 订阅

订阅专栏

实力超ChatGPT-4！阿里Qwen1.5上线！
腾朗AI对话腾朗AI对话 2024-04-07 19:16 湖南
阿里大模型，再次开源！
发布Qwen1.5版本，直接放出六种尺寸。
最大的 Qwen1.5-72B-Chat，超过了Claude-2.1, GPT3.5-Turbo-0613。
在某些方面，它的分数甚至比之前的GPT-4还要高。

来自世界各地的开发商纷纷前来道贺，尤其是0.5 B的迷你版，更是让很多人跃跃欲试。

Qwen-VL-Max这个多模态大模型，是不是可以开源？
在这里插入图片描述

另外，它还与 Hugging接口进行了整合，并与十几个主流框架进行了协作，从调试到部署，再到局部推理，一气呵成。
Qwen1.5开源
这一次开放源码的发布，主要集中在四个方面。
首先，有很多模型，我们将开放六个尺寸（0.5 B,1.8 B,4 B,7 B,14 B,72 B）的基本模型，聊天模型，和定量模型（Int4,Int8 GPTQ, AWQ, GGUF）。

其次，更多的生态融入。
现在， Qwen1.5的代码被整合进了 Hugging面部转换器中，使得它在没有trust_remote_code的情况下，transformers>=4.37.0。
在此基础上，项目还将与 vLLM, SGLang部署，Auto AWQ，Auto GPTQ, 用于微调的Axolotl、LLaMA-Factory以及用于本地 LLM 推理的llama.cpp等进行了合作。
Qwen1.5系列可以应用于 Ollama, LMStudio和其他的平台。另外，除了 DashScope，还有Together.ai的 API服务，全世界都可以使用 API服务。
图片

此外，它的性能也更加强大。
就拿基础能力来说， Qwen1.5-72 B在某些评分上，已经超越了GPT-4。
对于较长的上下文支持，整个序列模式的功能都得到了一些扩展。特别是 Chat模式，比如 Qwen1.5-7B-Chat,5项任务中的4项都能达到 GPT-3.5的水平。
Qwen1.5-72B-Chat比 GPT3.5-16 K要好得多，比GPT4-32K稍差一些。

在程序运行上，虽然72 B的聊天模式在数学和视觉效果上都比GPT-4差了一些，但是程序的运行速度却比GPT-4要快得多。
在这里插入图片描述

不过他们表示，未来的版本中得到增强。

而这一次，所有的功能都被更新了。
所有系列都统一支持最大长度为32 k；
多语种综合提高，多语种评价更加丰富；
全系列统一支持system prompt;
统一具备强链接外部系统能力（agent/RAG/Tool-use/Code-interpreter）在这里插入图片描述

智言AI

关注

10
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
实力超ChatGPT-4！阿里Qwen1.5上线！

首先，有很多模型，我们将开放六个尺寸（0.5 B,1.8 B,4 B,7 B,14 B,72 B）的基本模型，聊天模型，和定量模型（Int4,Int8 GPTQ, AWQ, GGUF）。在程序运行上，虽然72 B的聊天模式在数学和视觉效果上都比GPT-4差了一些，但是程序的运行速度却比GPT-4要快得多。最大的 Qwen1.5-72B-Chat，超过了Claude-2.1, GPT3.5-Turbo-0613。Qwen1.5-72B-Chat比 GPT3.5-16 K要好得多，比GPT4-32K稍差一些。
复制链接

扫一扫