现在大模型竞技场可谓龙争虎斗。之前阿里云的通义千问发布全球性能最强开源模型Qwen2-72B,就第一时间给大家介绍过。
想不到时隔半月,全球著名开源平台huggingface的联合创始人兼首席执行官Clem在社交平台宣布,来自中国的Qwen2-72B指令微调版本,成为全球开源模型排行榜第一名。
他表示,为了提供全新的开源大模型排行榜,使用了300块H100对目前全球100多个主流开源大模型,例如,Qwen2、Llama-3、mixtral、Phi-3等,在BBH、MUSR、MMLU-PRO、GPQA等基准测试集上进行了全新评估。
结果显示,阿里开源的Qwen-272B力压科技、社交巨头Meta的Llama-3、法国著名大模型平台Mistralai的Mixtral成为新的王者,中国在全球开源大模型领域处于领导地位。
包括72B在内,Qwen2开源系列共有五款模型,涵盖各个规格的参数。并且除英语和中文外,还接受过另外27 种语言的数据训练。在大量基准评估中表现出最先进的性能。
阿里这波操作简直震惊了所有人,谁也没想到,这样一个碾压所有的大模型竟是出自中国!
要知道,一直以来中国AI大模型都是在骂声中艰难前行的,国内“一开源就遥遥领先”的声音甚嚣尘上,很多知名科技类博主直言,中国厂商之所以能在短时间内造出那么多大模型,就是因为他们抄了国外的开源大模型,“别人一开源,我们就‘遥遥领先’”。
此外,还有各种花式吐槽自家大模型不是人工智能,其实是人工智障。如今,阿里云再次以实力反击了这些言论,值得敬佩!
其实如果有心的话,便会发现,国产大模型的实力早已进化得可以和全球顶尖厂商一较高下了。这两天闹得沸沸扬扬的斯坦福AI团队抄袭事件也足够证明这一点,外国的月亮并不比中国圆,国产AI正成为全球顶尖“抄作业”的对象。
看看国产AI的战绩就知道了。过去一年,包括Qwen在内的国产大模型在海外披荆斩棘,接连斩获多个大模型领域的重磅荣誉。仅Qwen-72B就先后登顶过两大全球权威开源大模型排行榜榜首。这些都是世界大模型领域极具份量的榜单,它们的认可无疑是对国产AI最好的褒奖。
与某些中国网友对自家AI大模型无脑喷的态度形成鲜明对比的是,海外网友对中国AI大模型一片赞誉。
很多外国网友表示,中国AI大模型在医学术语的使用上更准确,编程和推理能力也更强,甚至此前Qwen1.5版本在海外平台爆火的时候,就有相当数量的网友在催Qwen2早日更新。
目前,Qwen系列模型正在全球爆火,下载量已突破1600万次。海内外开源社区已出现超过1500款,基于Qwen二次开发的模型和应用。除了Llama开源生态之外,通义千问已成为全球开发者的另一主流选项。
这些铁铮铮的数据,既昭示着通义千问系列开源模型的受欢迎程度,也是对某些看不起国产AI大模型人士的最强硬反击。
诚然,国产AI大模型还有很多待改进的地方,但也真心希望有更多人能看到它的闪光点,毕竟一味地批判、贬损,除了长他人志气灭自己威风外,并不会对中国AI的崛起带来任何助益。信心比黄金更珍贵,相信国产AI还会给我们带来更大的惊喜!