Sora模型-相关问题-笔记

一、用AI模拟物理世界,指向AGI

OpenAI为Sora赋予的使命,不只是替代视频生成的创作者,更重要的是将视频生成作为帮助AI理解真实世界的模拟器,其研究论文的题目“Video generation models as world simulators”也透露了这一点。

从“理解世界”的角度审视Sora,核心不是某一帧图像的画质和画面关系,而是这个生成的视频在不同“机位”下所保持的高度“一致性”,这才是它接近真实的地方。

就像周鸿祎所说,“Sora只是小试牛刀,它展现的不仅是一个视频制作的能力,而是大模型对真实世界有理解和模拟之后,会带来新的成果和突破。”

在这一点上,Sora和特斯拉在FSD(Full self-driving,完全无人驾驶系统)上的指向是一致的。在FSD12上,特斯拉删除了30万行定义驾驶规则的代码,还移除了雷达系统,只依靠高清摄像头采集视频和神经网络学习来判断距离关系。

Sora和FSD的不同,仅在于二者感知世界的方式:后者以真实世界的车辆来感受,而前者单纯依靠数据的输入。

二、规模和质量是训练模型的核心

“特斯拉的数据来源于真实道路上搭载了传感器的车辆;而OpenAI的大量数据,从目前的公开信息来看,来源于网络。在质量的维度,特斯拉通过和Uber合作,获取‘五星司机’的素材训练FSD;而从规模出发,奥特曼最近希望筹集万亿美元规模的资金,就是注重计算力和规模的表现”[1]。

三、对计算资源的巨大需求

AI发展需要巨大的计算资源。

黄仁勋认为,“计算机架构在不断进步,如果不将‘计算机变得更快’纳入考量,那么我们可能需要4个太阳,才能为这一切提供燃料。”因此,芯片行业必须朝着更好、更具成本效益的方向前进,以降低AI技术的成本。

英伟达的AI GPU的交付周期,从去年底的8-11个月缩短到了目前的3-4个月。最近两个月,英伟达的股价上涨46%,总市值达到1.8万亿美元,超过Google和Amazon,仅次于微软和苹果。

OpenAI似乎有意与英伟达竞争。萨伊.奥特曼正在中东筹集资金,以支持OpenAI的一项半导体计划。

四、带来的挑战

1. 虚假视频

现在的解决做法是发布者在AI生产的内容上打水印,告知用户。如何识别不同平台生产的AI内容,还是一大难点。

参考资料

1. "Sora证明马斯克是对的,但特斯拉和人类可能输了",微信公众号:极客公园(ID: geekpark),作者:曹思颖.

2. “春节‘科技七巨头’市值排位洗牌:英伟达狂飙至第三”,微信公众号:时代周报(ID: timeweekly),作者:郭美婷.

  • 5
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值