Sora模型－相关问题－笔记

最新推荐文章于 2024-06-27 13:16:26 发布

爱吃杂酱面

最新推荐文章于 2024-06-27 13:16:26 发布

阅读量369

点赞数 5

文章标签：笔记人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ziyu9966/article/details/136183078

版权

一、用AI模拟物理世界，指向AGI

OpenAI为Sora赋予的使命，不只是替代视频生成的创作者，更重要的是将视频生成作为帮助AI理解真实世界的模拟器，其研究论文的题目“Video generation models as world simulators”也透露了这一点。

从“理解世界”的角度审视Sora，核心不是某一帧图像的画质和画面关系，而是这个生成的视频在不同“机位”下所保持的高度“一致性”，这才是它接近真实的地方。

就像周鸿祎所说，“Sora只是小试牛刀，它展现的不仅是一个视频制作的能力，而是大模型对真实世界有理解和模拟之后，会带来新的成果和突破。”

在这一点上，Sora和特斯拉在FSD（Full self-driving，完全无人驾驶系统）上的指向是一致的。在FSD12上，特斯拉删除了30万行定义驾驶规则的代码，还移除了雷达系统，只依靠高清摄像头采集视频和神经网络学习来判断距离关系。

Sora和FSD的不同，仅在于二者感知世界的方式：后者以真实世界的车辆来感受，而前者单纯依靠数据的输入。

二、规模和质量是训练模型的核心

“特斯拉的数据来源于真实道路上搭载了传感器的车辆；而OpenAI的大量数据，从目前的公开信息来看，来源于网络。在质量的维度，特斯拉通过和Uber合作，获取‘五星司机’的素材训练FSD；而从规模出发，奥特曼最近希望筹集万亿美元规模的资金，就是注重计算力和规模的表现”［１］。

三、对计算资源的巨大需求

AI发展需要巨大的计算资源。

黄仁勋认为，“计算机架构在不断进步，如果不将‘计算机变得更快’纳入考量，那么我们可能需要４个太阳，才能为这一切提供燃料。”因此，芯片行业必须朝着更好、更具成本效益的方向前进，以降低AI技术的成本。

英伟达的AI GPU的交付周期，从去年底的8-11个月缩短到了目前的3-4个月。最近两个月，英伟达的股价上涨46%，总市值达到1.8万亿美元，超过Google和Amazon，仅次于微软和苹果。

OpenAI似乎有意与英伟达竞争。萨伊.奥特曼正在中东筹集资金，以支持OpenAI的一项半导体计划。

四、带来的挑战

1. 虚假视频

现在的解决做法是发布者在AI生产的内容上打水印，告知用户。如何识别不同平台生产的AI内容，还是一大难点。

参考资料

1. ＂Sora证明马斯克是对的，但特斯拉和人类可能输了＂，微信公众号：极客公园（ID: geekpark），作者：曹思颖．

2. “春节‘科技七巨头’市值排位洗牌：英伟达狂飙至第三”，微信公众号：时代周报（IＤ: timeweekly），作者：郭美婷．

爱吃杂酱面

关注

5
点赞
踩
12

收藏

觉得还不错? 一键收藏
0
评论
Sora模型－相关问题－笔记

OpenAI为Sora赋予的使命，不只是替代视频生成的创作者，更重要的是将视频生成作为帮助AI理解真实世界的模拟器，其研究论文的题目“Video generation models as world simulators”也透露了这一点。从“理解世界”的角度审视Sora，核心不是某一帧图像的画质和画面关系，而是这个生成的视频在不同“机位”下所保持的高度“一致性”，这才是它接近真实的地方。Sora和FSD的不同，仅在于二者感知世界的方式：后者以真实世界的车辆来感受，而前者单纯依靠数据的输入。
复制链接

扫一扫

爱吃杂酱面 CSDN认证博客专家 CSDN认证企业博客

码龄4年

7: 原创

147万+: 周排名

13万+: 总排名

6496: 访问

: 等级

206: 积分

94: 粉丝

133: 获赞

6: 评论

128: 收藏

私信

关注

热门文章

最新评论

【笔记】英伟达提高CUDA的兼容难度
CSDN-Ada助手: 恭喜作者第8篇博客的发布！看到您关于英伟达提高CUDA兼容难度的笔记，不禁让人感叹您对技术的深入理解和对行业动态的关注。接下来，希望您可以继续保持创作的热情和努力，探索更多有趣的主题，或许可以尝试深入分析不同GPU厂商的技术发展趋势，或者是介绍一些实用的CUDA编程技巧，让更多读者受益。期待您的下一篇作品！愿您在技术之路上不断前行，不忘初心，砥砺前行。
Google最强开源大模型Gemma亮相！笔记本就能跑__笔记
爱吃杂酱面: 谢谢！
Google最强开源大模型Gemma亮相！笔记本就能跑__笔记
CSDN-Ada助手: 恭喜您第5篇博客的发布！Google最强开源大模型Gemma亮相，让笔记本也能跑起来，真是令人惊叹啊！希望您能继续保持创作的热情和努力，为我们带来更多有价值的内容。或许下一步可以深入探讨Gemma的应用场景，或者分享一些使用心得和技巧，让更多人受益。期待您的下一篇博客！
Meta为什么要开源AI基础软件__笔记
爱吃杂酱面: 谢谢！
Meta为什么要开源AI基础软件__笔记
CSDN-Ada助手: 恭喜你写了第四篇博客！看到你对开源软件基础设施的思考，让我受益匪浅。希望你能继续分享关于 Meta 和开源软件基础设施的见解，也可以考虑深入探讨开源软件的发展趋势或者实践经验。期待你的下一篇作品！加油！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。