AI大模型日报#0410：谷歌开放最强模型Gemini 1.5 Pro、GPT-4 Turbo重磅升级、开源模型首胜GPT-4-CSDN博客

本文链接：https://blog.csdn.net/lionkingcz/article/details/137606450

导读：欢迎阅读《AI大模型日报》，内容基于Python爬虫和LLM自动生成。目前采用“文心一言”生成了每条资讯的摘要。

标题: 谷歌最强大模型免费开放了！长音频理解功能独一份，100万上下文敞开用

摘要: 谷歌最强大模型Gemini 1.5 Pro已全面免费开放，支持API调用和AI Studio直接体验。该模型首次增加音频理解功能，可解析长音频，最长可处理约11小时音频。同时，其100万上下文窗口也对外开放。此外，原OpenAI开发者关系负责人Logan Kilpatrick已跳槽至谷歌。这一更新将极大提升AI在语音识别和上下文理解方面的能力。
网址: 谷歌最强大模型免费开放了！长音频理解功能独一份，100万上下文敞开用 | 量子位

标题: 英伟达竞品来了，训练比H100快70%，英特尔发最新AI加速卡

摘要: 英特尔在Vision 2024大会上展示了其子公司Habana Labs的新一代AI加速器Gaudi 3，计划于2024年第三季度推出。Gaudi 3具有高达1835 TFLOPS的FP8计算吞吐量，性能部分超过英伟达的H100，且能耗比更优。在一些大型语言模型中，Gaudi 3甚至能击败英伟达的旗舰GPU。此举或助英特尔在AI加速器市场获得更多份额，同时Gaudi系列已升级为英特尔旗舰AI加速器。
网址: 英伟达竞品来了，训练比H100快70%，英特尔发最新AI加速卡 | 机器之心

标题: 开源模型首胜GPT-4！竞技场最新战报引热议，Karpathy：这是我唯二信任的榜单

摘要: 要点提炼： 1. 开源模型Command R+在大模型竞技场上与GPT-4打成平手，甚至超过了部分版本的GPT-4，成为首个击败GPT-4的开放权重模型。 2. 大模型竞技场是受到大神Karpathy信任的测试基准之一。 3. Command R+来自AI独角兽公司Cohere，其CEO是Transformer最年轻作者Aidan Gomez。 4. 这一战报引发了大模型社区的热烈讨论，显示了大模型领域的持续发展和变化。
网址: 开源模型首胜GPT-4！竞技场最新战报引热议，Karpathy：这是我唯二信任的榜单 | 量子位

标题: 超越GPT-4V，苹果多模态大模型上新！

摘要: 苹果发布了新的多模态大语言模型Ferret-UI，专为理解移动UI屏幕设计，具有指向、定位和推理等多种能力。其灵活的输入格式和基础任务使其能在移动用户界面执行多项引用任务。关键技术「任何分辨率」解决了小型对象识别问题。Ferret-UI的发布预示着Siri未来可能变得更强大，有望实现一句话打开美团外卖下订单等功能。
网址: 超越GPT-4V，苹果多模态大模型上新！|UI|图像|推理_新浪新闻

标题: 「视觉版」GPT-4 Turbo重磅升级！ChatGPT 40条消息限制或取消

摘要: OpenAI在谷歌大会期间宣布GPT-4 Turbo重大升级，配备视觉能力并可通过API调用。新模型有128k上下文，训练数据截至2023年12月，同时支持Vision请求的JSON模式和函数调用。新模型可简化开发人员工作流程，创造更高效应用程序，但有研究发现其在编码方面较差，比现有GPT-4 Turbo preview模型更懒惰，代码编辑能力有所下降。已有开发者使用新模型开发出各种应用。
网址: 「视觉版」GPT-4 Turbo重磅升级！ChatGPT 40条消息限制或取消|谷歌_新浪新闻