谷歌AI大模型Gemini造假:演示视频经过编辑 描绘不切实际画面

9ab399ff02ea9df987e1122f8ae024cd.jpeg

雷递网 乐天 12月9日

就在人们惊呼谷歌推出的人工智能模型Gemini打爆GPT-4之际,谷歌却曝出令人尴尬的一幕。

谷歌被曝出Gemini的演示视频经过编辑,使其看起来更令人印象深刻。

据外媒披露,一位谷歌员工称,在他们看来,Gemini的视频描绘了一幅不切实际的画面:让Gemini 取得令人印象深刻的成绩是多么容易。另一位员工表示,他们对演示并不太感到惊讶,因为他们已经习惯了公司公开定位其产品的某种程度的营销炒作。(当然,所有公司都这样做。)“我认为大多数使用过法学硕士技术的员工都知道要对这一切持保留态度。”

在内部,一些谷歌员工一直在讨论在没有显著披露的情况下展示该视频是否会误导公众。在一个全公司范围的论坛上,一位谷歌员工分享了一个表情包,暗示鸭子视频被欺骗性地编辑过。

有谷歌员工在评论中表示,“我猜视频创作者更看重‘讲故事’方面。”

2222913eaf6ea08798e3fe4415fcf5d7.jpeg

谷歌确实透露,视频中显示的内容并不完全是Gemini的实际工作方式。“出于本演示的目的,为了简洁起见,延迟已经减少,Gemini 的输出也已缩短,”也就是说,视频显示了Gemini原始反应的较短版本,而人工智能系统花了更长的时间才想出这些反应。 

本周,谷歌宣布推出人工智能模型Gemini,谷歌宣称Gemini 1.0 复杂的多模式推理功能可以帮助理解复杂的书面和视觉信息。这使得它在发现大量数据中难以辨别的知识方面具有独特的能力。

Gemini 1.0 通过阅读、过滤和理解信息从数十万份文档中提取见解的卓越能力将有助于在从科学到金融的许多领域以数字速度实现新的突破。

Gemini 1.0 经过训练,可以同时识别和理解文本、图像、音频等,因此它可以更好地理解微妙的信息,并可以回答与复杂主题相关的问题。这使得它特别擅长解释数学和物理等复杂学科的推理。

谷歌的第一个版本的 Gemini 可以理解、解释和生成世界上最流行的编程语言(如Python、Java、C++ 和 Go)的高质量代码。它跨语言工作和推理复杂信息的能力使其成为世界领先的编码基础模型之一。

Gemini Ultra 在多个编码基准测试中表现出色,包括 HumanEval(用于评估编码任务性能的重要行业标准)和 Natural2Code(我们内部保留的数据集),该数据集使用作者生成的源而不是基于网络的信息。

使用Gemini 的专门版本,谷歌创建的代码生成系统 AlphaCode 2,擅长解决超出编码范围、涉及复杂数学和理论计算机科学的竞争性编程问题。

dd764dfbd996a0d30a3deb0a6be37845.jpeg

比如,一位老师画了一个滑雪者从斜坡上下来的物理问题,一位学生提出了一个解决方案来计算滑雪者在斜坡底部的速度。利用Gemini的多模态推理能力,该模型能读懂凌乱的笔迹,正确理解问题的表述,将问题和解决方案都转换为数学公式,识别出学生在解决问题时出错的具体推理步骤,给出问题的正确解决方案。

谷歌还将Gemini引入Pixel。Pixel 8 Pro是第一款运行Gemini Nano的智能手机,它支持 Recorder 应用中的 Summarize等新功能,并从WhatsApp开始推出Gboard中的Smart Reply,明年还会推出更多应用。

对于造假的说法,谷歌DeepMind产品副总裁伊莱·柯林斯 称,画鸭子演示仍然是研究级别的功能,至少目前还没有出现在谷歌的实际产品中。

———————————————

雷递由媒体人雷建平创办,若转载请写明来源。

6520e0745e8b8406a596069e950d06ff.jpeg

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值