最新SuperCLUE测评出炉 云从科技从容大模型居第一梯队

在人工智能领域不断突破的浪潮中,中国本土企业云从科技再次以卓越的技术实力引领潮流。

近日,权威测评机构SuperCLUE发布了《中文大模型基准测评4月报告》,报告中AI智能体(AI-Agent)领军企业云从科技自主研发的从容大模型凭借其在多个领域的出色表现,赢得了行业内外的广泛关注,不仅成功晋升至SuperCLUE模型象限的【领导者象限】,更以总分70.35分的佳绩稳居大模型第一梯队的行列。

此次测评覆盖了32个国内外知名的大模型,刨除BAT,榜单上展现着中国最强AI企业的身影,分别是百川智能、智谱AI、月之暗面、MiniMax、云从科技。

中国AI大模型五虎呼之欲出。

尤其值得关注的是,相较于广受推崇的GPT系列模型,从容大模型不仅超越了GPT3.5,而且与当前全球领先的GPT-4的差距仅4.97分,与GPT4 Turbo的差距也保持在合理范围,这无疑预示着云从科技在大模型领域正逐步逼近国际最前沿。

据悉,从容大模型最大的亮点在于,通过自研的多模态大模型基础架构“all in one Transformer”,仅需百分之一的算力即可实现媲美第一梯队的AI性能,更有利于降本增效,进一步推动行业大模型的推广和应用。

从容大模型的测评结果充分展现了其在综合能力上的均衡与卓越。特别在计算能力方面,该模型以75.8分的高分独占鳌头,位居国内首位,凸显了其在处理复杂数理运算方面的强大实力。

此外,在知识百科能力上取得80.6分,排名国内第三,这表明从容大模型在广泛知识领域具有深厚积累与高效应用能力。而在语义理解方面,74.8分的成绩同样证明了其在理解复杂语言结构与上下文含义方面的能力,排名国内前五。尽管在代码能力方面有待提升,但整体而言,从容大模型已展现出全面且强大的智能处理潜能。

更值得注意的是,从容大模型在与全球顶级模型GPT-4的直接对决中,取得了20.79%的对战胜率,这一成绩仅次于Claude3-Opus,进一步验证了其在实际应用中的竞争力。这不仅是对云从科技研发团队不懈努力的认可,也是中国AI技术实力的有力证明。

此前,云从科技更是在全球最权威的人脸识别FRVT测试1:1和1:N刷新2项世界纪录;行人基础大模型在PA-100K、RAPV2、PETA、HICO-DET四个数据集上超越了包括阿里巴巴、日立等多家知名高校、企业与研究机构,刷新了世界纪录;

商品基础大模型在MUGE、Product1M两个规模最大的开源中文多模态商品检索数据集上从百度、快手、京东和OPPO等多家知名高校、企业与研究机构脱颖而出,刷新了世界纪录;

在多媒体领域唯一CCFA类顶级国际人工智能学术会议ACMMM提出视觉-语言跟踪大一统模型All-in-One,并在跨模态领域(TNL2K,LaSOT,LaSOTExt,WebUAV-3M)刷新4项世界纪录;

视觉大模型在benchmarkCOCO上从微软研究院(MSR)、上海人工智能实验室、智源人工智能研究院等多家知名企业与研究机构脱颖而出,刷新了世界纪录;多模态大模型在ICCV2023细粒度行为检测挑战赛(OpenFineGrainedActivityDetectionChallenge)中战胜早稻田大学、软银等国内外多家知名企业、科研机构,斩获冠军。

云从科技从容大模型在SuperCLUE的综合基准测评中所取得的成就,不仅标志着中国在AI大模型研发上的显著进步,也预示着云从科技在全球AI竞争版图中正占据越来越重要的位置。随着持续的技术创新与优化,云从科技有望在未来进一步缩短与国际最先进水平的差距,甚至实现超越,为中国乃至全球的人工智能发展贡献更加强劲的推动力。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值