一文了解GPT-4o mini:成本低、性能高、支持128K上下文,开发者必备利器!

一文了解GPT-4o mini:成本低、性能高、支持128K上下文,开发者必备利器!

前言

QQ截图20240717143114.png

GPT-4o mini

OpenAI 刚刚官宣了一则重磅消息:全新的"迷你"大语言模型 GPT-4o mini 正式上线!这一次,OpenAI 在 AI 领域又一次掀起了波澜。GPT-4o mini 不仅继承了 GPT-4o 的强大性能,还以更低廉的成本、更小巧的体积,为开发者和企业用户提供了一个高性价比的选择。

GPT-4o mini的价位

QQ截图20240719143409.png

更低的价位

目前 GPT-4o mini 能支持高达 128K tokens 的上下文输入,输出长度也能达到 16K tokens 。如果说 GPT-4o 是一位全能选手,那么 GPT-4o mini 就是一位"小个子"运动员,在某些特定项目上的表现甚至更加出色。

更让人惊喜的是 GPT-4o mini 的定价。根据 OpenAI 官网信息,其输入价格仅为15美分/百万 tokens ,输出60美分/百万 tokens 。相比之下,此前备受欢迎的 GPT-3.5 Turbo 的价格是50美分/百万 tokens 和150美分/百万 tokens 。而顶级旗舰模型 GPT-4o 的价格就更高了,输入5美元/百万 tokens ,输出15美元/百万 tokens 可以说,GPT-4o mini 的推出,让高质量的 AI 模型变得更加"平民化"。

GPT-4o mini性能测试

QQ截图20240719143500.png

性能对比

GPT-4o mini 在各项性能测试中均取得了优异的成绩。在 MMLU 测试中,它获得了82%的高分,超越同级别的 Gemini Flash(77.9%)和 Claude Haiku(73.8%),甚至逼近顶级模型 GPT-4o(88.7%)的水准。

在数学和编程能力方面,GPT-4o mini 同样表现抢眼。MGSM 和 HumanEval 的测试中,GPT-4o mini 分别以87.0%和87.2%的成绩领跑小模型阵营,将 Gemini Flash 和 Claude Haiku 远远甩在身后。

即使在更有挑战性的多模态推理测试 MMMU 中,GPT-4o mini 依然以59.4%的成绩力压群雄。而在 LMSYS 排行榜上,它的聊天偏好评分甚至还要优于"大哥" GPT-4。这个"小个子"展现出了惊人的潜力。

GPT-4o mini的安全性

作为首个使用"指令层次结构"安全策略的AI模型,GPT-4o mini在追求高性能和低成本的同时,也更加注重用户的安全。OpenAI邀请了70多位跨领域专家对GPT-4o进行了风险评估,并根据反馈对模型进行了优化,提高了模型的鲁棒性,让输出更加可靠。

OpenAI通过改进模型结构、优化训练数据和训练流程等一系列技术创新,在保证性能的同时成功地降低了成本。相比两年前的text-davinci-003模型,如今GPT-4o mini的每token成本已经下降了99%。这一突破性的进展,让AI民主化进程大大加速。

总结

强大的性能、亲民的价格、灵活的部署,GPT-4o mini具备成为开发者必备利器的一切潜质。128K的超长上下文支持,更是让它在对话、写作等场景中的表现更加出色。GPT-4o mini的到来,预示着AI技术正迎来新的篇章。

厚德云是一款专业的AI算力云平台,为用户提供稳定、可靠、易用、省钱的 GPU 算力解决方案。海量 GPU 算力资源租用,就在厚德云。

  • 3
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值