Google的Gemini 1.5 Pro性能如何?与OpenAI的GPT-4o一较高下

  每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领域的领跑者。点击订阅,与未来同行! 订阅:https://rengongzhineng.io/

Google的Gemini 1.5 Pro发布已有一段时间,支持多达100万个token。最近,这家位于山景城的科技巨头在2024年Google I/O大会上宣布,开发者很快就能尝试一个2M token版本。

那么,Gemini 1.5 Pro的实际表现如何?通常,基准测试数据是一个好的起点,尽管它不一定能完全描绘出全貌。事实证明,无论是Gemini 1.5 Pro,还是其“高级版”在某些类别中都与OpenAI最新的GPT-4o不相上下。

表现对比

正如上图所示,根据LMSYS Org的整体排行榜对比,Gemini-1.5-Pro-API-0514和Gemini-Advanced-0514在Arena Elo系统测量下接近GPT-4o。这两个模型在中文领域也极受欢迎,且在“难题”类别中表现突出。

Arena Elo系统通过让用户匿名投票选择哪个模型在随机对决中表现更好,来衡量大型语言模型(LLM)的技能,并像国际象棋的Elo系统一样更新其评级。这个非营利性AI组织专注于对比模型的表现。

Gemini 1.5 Flash现已在Google AI Studio和Vertex AI上可供试用。对于一个小型轻量级模型,它的表现确实与微软Phi-3系列最新成员Phi-3-vision和Phi Silica相媲美。

与OpenAI的比较

OpenAI不久前推出了新的GPT-4o模型和ChatGPT桌面应用,预期非常高。最新的模型使AI聊天机器人在与用户对话时听起来极具人性化。

总的来说,Google的Gemini 1.5 Pro在多个方面表现出色,尤其是在某些特定类别中能与OpenAI的最新模型一较高下。这使得它在AI技术竞赛中占据了一席之地,并展示了其强大的竞争力和创新能力。

  • 7
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值