Gemini火力全开！Project Astra正面硬刚GPT-4o，视频AI震破Sora

最新推荐文章于 2024-06-05 14:18:06 发布

程序员与诗人

最新推荐文章于 2024-06-05 14:18:06 发布

阅读量769

点赞数 27

文章标签：人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_58552717/article/details/139001978

版权

互联网大事件专栏收录该内容

11 篇文章 1 订阅

订阅专栏

在刚刚过去的谷歌I/O 2024大会上，谷歌推出了一系列令人眼花缭乱的AI更新和新功能，全面反击OpenAI最新的GPT-4o。

Gemini时代的开启

大会一开始，谷歌CEO Sundar Pichai宣布：“我们已经完全进入了Gemini时代。”

Gemini是谷歌最新的多模态AI模型，它的更新版本Gemini 1.5 Pro将上下文窗口扩大到了200万tokens，使得它可以处理更长的文本和复杂的多媒体文件。

Pichai表示，谷歌正处于AI平台转变的早期阶段，未来充满了机遇。

新版本Gemini Live还支持实时、深度语音对话，可以通过摄像头观察并分析环境，然后给出回应。这一点和chatgpt4-o简直一模一样

面对OpenAI的挑战，谷歌推出了Project Astra，这是一款日常生活中的AI代理。

Astra不仅可以理解实时音频和视频，还能进行推理并给出反馈。

例如，一位用户可以通过手机摄像头让AI识别办公室环境，并提问相关问题，AI代理能帮助用户完成诸如退货等操作。

虽然目前仍处于原型开发阶段，但Astra已经展示了它在日常生活中潜在的巨大应用前景。

Gemini Live和Gemini Nano

Gemini Live是谷歌推出的一款语音对话功能，旨在使人们与AI的交流更加自然。用户可以通过它用语音与Gemini交流，AI可以根据用户的指令进行实时调整。

Gemini Nano则是支持多模态的轻量级版本，能够处理文本、图片和音频，适用于更广泛的应用场景。

AI生成视频工具Veo

几个月前，OpenAI展示了Sora视频生成工具，谷歌不甘示弱，推出了自己的视频生成工具Veo。

Veo可以生成一分钟长的1080p视频，用户可以通过文本提示生成带有特效的视频。这一功能不仅展示了谷歌在视频生成方面的技术实力，也为未来的视频创作提供了无限可能。

将Gemini融入Android和Google Workspace

谷歌将Gemini与Android系统深度融合，使用户在浏览手机时，AI可以理解和预测用户的需求。

此外，Gemini还被整合到Google Workspace中，使其更加智能。例如，在Gmail中，Gemini可以总结所有关于学校的电子邮件，在Google Meet中，它可以总结会议重点。

长期以来，人们认为谷歌在AI领域处于跟随者的位置，但这次I/O大会展示了谷歌在AI方面的强大实力。

从超长的上下文窗口到多模态的AI助手，再到AI生成的视频工具，谷歌在多个方面展现了其技术优势。与OpenAI的发布会相比，谷歌的发布会更注重展示产品的实际应用，这也使得谷歌的AI技术更具吸引力。

结语

谷歌在I/O 2024大会上的表现无疑展示了其在AI领域的雄心和实力。从多模态AI模型Gemini，到日常生活中的AI代理Project Astra，再到AI生成视频工具Veo，谷歌正在全面提升其AI技术，并将其应用到人们的日常生活中。

发布会视频链接：https://twitter.com/i/status/1790542872711667841

程序员与诗人

关注

27
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
Gemini火力全开！Project Astra正面硬刚GPT-4o，视频AI震破Sora

长期以来，人们认为谷歌在AI领域处于跟随者的位置，但这次I/O大会展示了谷歌在AI方面的强大实力。从超长的上下文窗口到多模态的AI助手，再到AI生成的视频工具，谷歌在多个方面展现了其技术优势。与OpenAI的发布会相比，谷歌的发布会更注重展示产品的实际应用，这也使得谷歌的AI技术更具吸引力。结语谷歌在I/O 2024大会上的表现无疑展示了其在AI领域的雄心和实力。
复制链接

扫一扫

专栏目录

程序员与诗人 CSDN认证博客专家 CSDN认证企业博客

码龄3年

339: 原创

5108: 周排名

3608: 总排名

26万+: 访问

: 等级

8095: 积分

4204: 粉丝

4546: 获赞

53: 评论

3386: 收藏

私信

关注

热门文章

最新评论

UI 自动化分布式测试 -Docker Selenium Grid
CSDN-Ada助手: 恭喜你这篇博客进入【CSDN每天值得看】榜单，全部的排名请看 https://bbs.csdn.net/topics/618832686。
vue中使用WebSocket心跳机制与Linux中的心跳机制
2401_84850808: 写的很详细，感谢博主的分享。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
使用Monkey命令做简单的安卓APP稳定性测试
2401_84544406: 优质好文，博主的文章细节很到位，兼顾实用性和可操作性，感谢博主的分享，文章思路清晰【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
一篇带你彻底搞懂 Python 编程进阶之闭包
TingXiao-Ul: 看了文章，终于明白“闭包可以用于实现记忆功能或保持特定状态的函数”这句话的意思了
Python爬取天气数据及可视化分析！（含源码）
狂野爷: 为什么我的pycharm中没有json这个库？

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。