实力超ChatGPT-4!阿里Qwen1.5上线!

1 篇文章 0 订阅
1 篇文章 0 订阅

实力超ChatGPT-4!阿里Qwen1.5上线!
腾朗AI对话 腾朗AI对话 2024-04-07 19:16 湖南
阿里大模型,再次开源!
发布Qwen1.5版本,直接放出六种尺寸。
最大的 Qwen1.5-72B-Chat,超过了Claude-2.1, GPT3.5-Turbo-0613。
在某些方面,它的分数甚至比之前的GPT-4还要高。
图片

来自世界各地的开发商纷纷前来道贺,尤其是0.5 B的迷你版,更是让很多人跃跃欲试。
图片

Qwen-VL-Max这个多模态大模型,是不是可以开源?
在这里插入图片描述

另外,它还与 Hugging接口进行了整合,并与十几个主流框架进行了协作,从调试到部署,再到局部推理,一气呵成。
Qwen1.5开源
这一次开放源码的发布,主要集中在四个方面。
首先,有很多模型,我们将开放六个尺寸(0.5 B,1.8 B,4 B,7 B,14 B,72 B)的基本模型,聊天模型,和定量模型(Int4,Int8 GPTQ, AWQ, GGUF)。
图片

其次,更多的生态融入。
现在, Qwen1.5的代码被整合进了 Hugging面部转换器中,使得它在没有trust_remote_code的情况下,transformers>=4.37.0。
在此基础上,项目还将与 vLLM, SGLang部署,Auto AWQ,Auto GPTQ, 用于微调的Axolotl、LLaMA-Factory以及用于本地 LLM 推理的llama.cpp等进行了合作。
Qwen1.5系列可以应用于 Ollama, LMStudio和其他的平台。另外,除了 DashScope,还有Together.ai的 API服务,全世界都可以使用 API服务。
图片

此外,它的性能也更加强大。
就拿基础能力来说, Qwen1.5-72 B在某些评分上,已经超越了GPT-4。
对于较长的上下文支持,整个序列模式的功能都得到了一些扩展。特别是 Chat模式,比如 Qwen1.5-7B-Chat,5项任务中的4项都能达到 GPT-3.5的水平。
Qwen1.5-72B-Chat比 GPT3.5-16 K要好得多,比GPT4-32K稍差一些。
图片

在程序运行上,虽然72 B的聊天模式在数学和视觉效果上都比GPT-4差了一些,但是程序的运行速度却比GPT-4要快得多。
在这里插入图片描述

不过他们表示,未来的版本中得到增强。

而这一次,所有的功能都被更新了。
所有系列都统一支持最大长度为32 k;
多语种综合提高,多语种评价更加丰富;
全系列统一支持system prompt;
统一具备强链接外部系统能力(agent/RAG/Tool-use/Code-interpreter)在这里插入图片描述
在这里插入图片描述

  • 10
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值