中国电信研究院发布天罡大模型评测榜单，豆包大模型排名国产第一

CSDN资讯

于 2024-08-27 12:22:17 发布

阅读量1.2k

点赞数 1

文章标签：豆包大模型字节跳动

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/csdnnews/article/details/141599666

版权

近日，中国电信研究院携手上海人工智能实验室、清华大学等产学研机构，发布了天罡通用大模型评测榜单。该榜单重点围绕大模型的能力和安全指标进行评估，GPT-4o综合成绩排名第一；豆包pro、通义千问Qwen-Max和智谱GLM-4在国产大模型中名列前三。

在这里插入图片描述

图：“天罡”通用大模型评测榜单

本次测评通过全面评测维度、权威评测题库、动态抽题、多裁判模型判别和人工审核等机制对国内外主流通用大模型开展了评测，评测对象包括国际头部闭源OpenAI的GPT-4系列、Google的Gemini系列、Anthropic的Claude系列、国内主流的闭源模型以及国内外主流的开源模型，评测结果展示了当前开源/闭源通用大模型整体能力分布和差距。

评测结果显示，GPT-4o在语言理解、认知推理、智能体等方面能力表现出色，总得分82.55分。国内头部大模型豆包、智谱清言在中文场景已达到GPT-4o的90%分位水平。其中，豆包pro模型得分达到79.38分，不仅在国产模型中排名最高，同时也超过了Gemini 1.5 pro、Claude3-Opus、Mistral Large等海外模型。

豆包大模型由字节跳动自研，是国内首批通过算法备案的大模型之一，正在通过字节跳动旗下云服务平台火山引擎面向企业提供服务。在近日召开的火山引擎AI创新巡展上海站活动中，新版豆包语言模型正式亮相，宣布其综合能力相比今年5月首次发布时提升了20.3%。

博客等级

码龄8年

博客专家认证

8564
原创

14万+
点赞

17万+
收藏

12万+
粉丝

关注

私信

热门文章

分类专栏

展开全部收起

上一篇：: 苹果宣布9月10日举行发布会；华为余承东：问界新M7 Pro卖一辆亏近3万元；Steam一夜遭28万次攻击 | 极客头条...

下一篇：: “我开发的副业项目成功了，但我恨死它了！”

最新评论

倒计时2天！第20届“开源中国开源世界”大会全议程发布
VU-zFaith870: 真期待这么多博才聚在一起会摩擦出怎样的火花!
高考作文“抽象”冲上热搜，ChatGPT、DeepSeek等推理大模型集体上场，实测来了！
角落里一曲lovesong: 坚韧的声音，民族的脊梁人类文明的进程中，总有一些声音在困境、苦难中坚韧地响起。它们可能来自一位身处低谷的艺人、一只满怀热忱的鸟儿、或是一位看透历史的诗人。这些声音汇聚在一起，共同述写了一部动人的民族史诗，昭示着勇气、希望与坚不可摧的信念。《鼓书艺人》中的他，尽管心里五味杂陈，终究无法开口歌唱。他的沉默或许是一种无奈，但更闪烁出对文化传承的坚定信仰。在那个动荡而充满不确定性的年代，艺人们的每一次表演不仅仅是一段故事的发生，更是一份文化的延续与守护。他们的心中燃烧着一团无法熄灭的火焰，即便在最暗淡的时刻仍然期待着能有再次开口的那一天。艾青笔下的鸟儿，即便喉咙嘶哑，依然以坚定的信念歌唱。这喻示着爱国、热爱生活的情怀。它用自己的歌声向世界传达出内心最真实的感受，那是对土地、对家园、对人民的热爱。即便环境恶劣、身体受限，它也不愿放弃歌唱，正如经历风波的民族，哪怕身处逆境，也不曾放弃希望，不曾放弃自我表达的权利。穆旦以高昂的热情，高举带血的手，表达了对复兴的期待与拥抱。他用血与泪书写的诗篇，是对民族复兴的呐喊，是擎天巨臂般的宣告。一个民族的崛起，需要无数有识之士用自己的心血去浇灌，在黑暗中摸索前行，艰难地开辟新的道路，最终迎来曙光时刻。每一点微光，汇聚起来，便成了能刺破夜幕的黎明。这些文字带领我们穿越历史的长河，看见了在不同的时代中，那些勇敢、坚韧、不屈的灵魂。他们以各自的方式，守护着心中的信念与梦想，用最真挚的声音传递着顽强的精神力量，最终推动着整个民族不断前行。在这些文学作品的启示下，我们不仅应当珍惜眼前的和平与繁荣，更应铭记那些为了今天而拼搏过的灵魂。他们以不同的方式发声，尽管其中充满了无奈与痛苦，虽然时而显得嘶哑或鲜血淋漓，但他们共同构筑了一条坚实的民族脊梁。一位鼓书艺人的沉默、一只鸟儿嘶哑的歌唱、一位诗人手中的鲜血，都是在诉说着祖国与人民的故事。在这个快速发展的时代，我们需要从这些坚韧传承中汲取力量，勇敢面对前路的挑战。我们应时刻铭记，无论面对怎样的风雨与考验，我们都应该以不屈不挠的精神去坚持，对未来充满希望，用自己的声音去影响和改变世界。正如这些文学作品所传达的精神一样，我们每个人都可以成为坚韧的声音，构筑起民族的不朽传奇。
“别再被AI骗了，写软件真的很难！”
Naiva: 哈哈试一试cursor
微软“杀死” WSA，Windows 11失去最终支持！
VU-zFaith870: 不过这篇咨讯:https://blog.csdn.net/csdnnews/article/details/148484369?spm=1000.2115.3001.10525。微软想要提高win11销量倒要废掉win10，Linux又不是太全能，恐怕微软真的面临破产的危机...
两周生成1.2万行代码！10年码龄开发者对AI「祛魅」：“把我整个代码库给炸了”!
小黑汁程序员: 没认识过这个ai，长见识了

大家在看

最新文章

2025

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

CSDN资讯 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。