每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领域的领跑者。点击订阅,与未来同行! 订阅:https://rengongzhineng.io/
Chatbot竞技场传来激动人心的消息!
@GoogleDeepMind的新款Gemini 1.5 Pro(实验版0801)在过去一周内进行了测试,获得了超过12,000次社区投票。首次,Google Gemini成功登顶,超越了GPT-4o和Claude-3.5,以惊人的1300分位居榜首,并在视觉排行榜上也名列第一。
Gemini 1.5 Pro(0801)在多语言任务方面表现出色,并在数学、复杂提示和编程等技术领域表现强劲。
恭喜@GoogleDeepMind取得这一显著成就!
Gemini(0801)类别排名:
- 总体:#1
- 数学:#1-3
- 指令跟随:#1-2
- 编程:#3-5
- 复杂提示(英语):#2-5
快来体验这个模型.
Gemini 1.5 Pro(实验版0801)在视觉排行榜上排名第一。
Gemini显示出强大的多语言能力:中文、日文、德文、俄文表现排名第一。
但在编程和复杂提示领域,Claude 3.5 Sonnet、GPT-4o和Llama 405B仍然领先。
总体胜率热图:Gemini 1.5 Pro(0801)对阵GPT-4o的胜率为54%,对阵Claude-3.5-Sonnet的胜率为59%。