通义千问 Qwen2,登顶国内第一大模型!

大家好,我是煎鱼。

7 月 9 日起,OpenAI 将正式终止对部分地区(包含中国)提供 API 服务,引起业内一片哗然,纷纷开始自检,找新的国内可用的国产化替代方案。

5adfd0c0c2dff16200b97e64c384947c.jpeg

此时我有一个朋友的 Boss,结合各家大模型的表现和价格(性价比),推荐了阿里云的通义千问。

尤其是提起最近新出的开源大模型 Qwen2 系列。非常强!今天特意了解了下,做一个快速的介绍分享。

通义千问 Qwen2

2024 年 6 月 7 日,通义千问正式发布了 Qwen2 系列,其包含 5 个尺寸的预训练和指令微调模型,分别是:

  • Qwen2-0.5B

  • Qwen2-1.5B

  • Qwen2-7B

  • Qwen2-57B-A14B

  • Qwen2-72B

其中最特别的是:Qwen2-72B,性能超过美国最强的开源模型 Llama3-70B,也在多个测评中超过文心 4.0、豆包 pro、混元 pro 等众多国内闭源大模型。

体验使用上,所有同学都可以在魔搭社区或 Hugging Face 免费下载通义千问最新开源模型。

Qwen-2开源地址:https://huggingface.co/Qwen/Qwen2-72B-Instruct

快速体验

大家如果想要方便一点的,也可以直接访问通义大模型官网:https://tongyi.aliyun.com/qianwen/ 。对外界面上提供的就是通义千问 2.5,可以直接免费体验。

百闻不如一见。我快速测试了几个 case。

1、写 SQL 语句:

c0ec67f7d5f5ad5b810853f0f1b50368.jpeg

2、写短视频剧本:

377abe4e43b3845c600355c458c4614b.jpeg

3、写工作周报:

a0f40fba9d7537a6a873ae1603766669.jpeg

整体几轮测试下来,通义千问在每轮的问答上,性能不错,回复速度很快。明显感觉比 GPT 快的多。

内容的有效性上,我个人觉得都挺不错。尤其是认真看了周报部分。通义千问现在已经很强了。这个场景下对于现实职场的适配度高。

大模型评测数据

个人的体验可能还是有限的。这里有一些业内专家对各大模型的评测。

可以参照看看,自行根据业务场景识别。

Qwen2-72B 开源模型第一

6 月 27 日,全球著名开源平台 huggingface 的联合创始人兼首席执行官 Clem 在社交平台宣布,阿里最新开源的 Qwen2-72B 指令微调版本,成为开源模型排行榜第一名。

08647b9a057b6ce36246b2755b937605.png

他表示,为了提供全新的开源大模型排行榜,使用了 300 块 H100 对目前全球 100 多个主流开源大模型,例如,Qwen2、Llama-3、mixtral、Phi-3 等,在 BBH、MUSR、MMLU-PRO、GPQA 等基准测试集上进行了全新评估。

ed4a1602d32ed831d4cc79ce340aa758.png

结果显示,阿里开源的 Qwen-2 72B 力压科技、社交巨头 Meta 的 Llama-3、法国著名大模型平台 Mistralai 的 Mixtral 成为新的王者,中国在全球开源大模型领域处于领导地位。

Qwen2 测评榜单国内第一

上海人工智能实验室大模型测评榜单 Compass Arena,最近公布了最新结果:

a3aa38b117244247f48068dc0f9896b6.png

Qwen2-72B 得分仅次于 GPT-4o,以 1 分之差排名第二,成为排名最高的开源大模型,总成绩超过文心 4.0、讯飞星火 3.5 等国内闭源大模型。

用户口碑

Qwen2的编码和推理能力比同等规模的 llama-3-8b 更好,无需专门训练即可编写俄罗斯方块游戏:

9b0058b2c2b7ea85fbc9da757a800eb6.png 4a9bc7145589d19856af677a281d0149.png

总结

讲了很多内容,可以看的出来通义千问在不断地持续进化,直至现在 Qwen2 系列已经到了 “遥遥领先” 国内各大模型的地步了。

还有一个关键点,通义有自己阿里云基于自研的异构芯片互联体系,在基础设施层,阿里云灵骏智算集群具备高达十万卡 GPU 的扩展性。这是其他国内厂商都所难以在短时间内匹敌的。

推荐大家可以尝试接入使用看看!

  • 20
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值