abab 模型进展｜MiniMax 发布万亿 MoE 模型abab 6.5

最新推荐文章于 2025-05-18 20:17:36 发布

MiniMax开放平台

最新推荐文章于 2025-05-18 20:17:36 发布

阅读量1.7k

点赞数 10

文章标签：语言模型 ai 人工智能机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/MiniMaxi/article/details/137969127

版权

2024 年 4 月 17 日，MiniMax 正式推出abab 6.5 系列模型。在 MoE 还没有成为行业共识时，MiniMax 花了 80% 以上的精力下注 MoE，并于今年 1 月，发布了国内首个基于 MoE 架构的 abab 6。在过去的三个月里，我们进一步地挖掘了 MoE 架构的潜力，研发出了更强大的 abab 6.5。

这个过程中，我们找到了越来越多加速实现 Scaling Laws 的途径，包括改进模型架构，重构数据 pipeline，训练算法及并行训练策略优化等。今天发布的 abab 6.5 和 abab 6.5s 是我们加速 Scaling Laws 过程的阶段性成果。

abab 6.5 系列包含两个模型：abab 6.5 和 abab 6.5s。abab 6.5 包含万亿参数，支持 200k tokens 的上下文长度；abab 6.5s 跟 abab 6.5 使用了同样的训练技术和数据，但是更高效，支持 200k tokens 的上下文长度，可以 1 秒内处理近 3 万字的文本。

在各类核心能力测试中，abab 6.5开始接近 GPT-4、 Claude-3、 Gemini-1.5 等世界上最领先的大语言模型。

核心能力测试

我们用业界标准的开源测试集来测试两个模型，在知识、推理、数学、编程、指令遵从等维度上和行业领先的语言模型进行了对比。

--标注星号的为我们调用API测试得到的结果，其余分数来自对应的技术报告

我们在 200k token 内进行了业界常用的“大海捞针”测试，即在很长的文本中放入一个和该文本无关的句子（针），然后通过自然语言提问模型，看模型是否准确将这个针回答出来。在 891 次测试中，abab 6.5 均能正确回答。

abab 6.5 和 abab 6.5s 会滚动更新到 MiniMax 旗下的产品中，包括生产力产品海螺 AI 和 MiniMax 开放平台上。欢迎大家使用。

联系我们

更多咨询详见官网

minimaxi.com

商务合作请联系

open-platform@minimaxi.com

MiniMax开放平台

博客等级

码龄1年

14
原创

102
点赞

91
收藏

76
粉丝

关注

私信

热门文章

最新评论

数百万小时，6秒，万分之五｜效果不输 ElevenLabs 和 OpenAI, MiniMax 语音大模型能用来做什么？
Lembas: 请问下目前支持定制自己的voice id吗？以及哪里可以找到可选择的voice id列表呢？
活动｜ MiniMax 和开发者一起度过的周末
CSDN-Ada助手: 恭喜您在MiniMax活动中度过了愉快的周末，并且成功地写下了第11篇博客！您的持续创作让我们感到非常鼓舞，希望您能继续保持写作的热情和耐心。或许下一步可以考虑分享您在活动中学到的技术经验或者对未来的展望，让读者更加期待您的下一篇作品。期待您的精彩继续！
如何让你的大模型更聪明？
CSDN-Ada助手: 恭喜用户写了第10篇博客，“如何让你的大模型更聪明？”这个话题非常有意义，对于提升模型性能有很大帮助。希望用户能够继续保持创作的热情和努力，不断分享有价值的内容给大家。下一步建议可以尝试探讨如何优化模型训练过程中的超参数选择，或者深入分析模型预测结果的可解释性等方面，让读者有更深入的了解和收获。期待用户的更多精彩作品！
寻找大法师，MiniMax 开发者合作计划招募啦！
CSDN-Ada助手: 恭喜你写了第8篇博客，标题看起来很吸引人！希望你能继续保持创作的热情和动力。对于下一步的创作建议，我认为你可以考虑深入探讨MiniMax 开发者合作计划的具体内容，或者分享一些寻找大法师的心得体会，这样可以让读者更加深入地了解这个话题。希望我的建议能对你有所帮助，期待你的下一篇博客！
第一节AI春晚来啦～
CSDN-Ada助手: 恭喜博主能够持续创作！看到标题我就感受到了春晚的喜庆气氛，很期待阅读这篇博客。在AI领域探索并分享，实在令人敬佩。希望博主能够继续保持创作的热情，可以尝试探讨AI在春晚中的应用，或是分享一些有趣的AI创作故事。期待更多精彩内容！

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。