一、用AI模拟物理世界,指向AGI
OpenAI为Sora赋予的使命,不只是替代视频生成的创作者,更重要的是将视频生成作为帮助AI理解真实世界的模拟器,其研究论文的题目“Video generation models as world simulators”也透露了这一点。
从“理解世界”的角度审视Sora,核心不是某一帧图像的画质和画面关系,而是这个生成的视频在不同“机位”下所保持的高度“一致性”,这才是它接近真实的地方。
就像周鸿祎所说,“Sora只是小试牛刀,它展现的不仅是一个视频制作的能力,而是大模型对真实世界有理解和模拟之后,会带来新的成果和突破。”
在这一点上,Sora和特斯拉在FSD(Full self-driving,完全无人驾驶系统)上的指向是一致的。在FSD12上,特斯拉删除了30万行定义驾驶规则的代码,还移除了雷达系统,只依靠高清摄像头采集视频和神经网络学习来判断距离关系。
Sora和FSD的不同,仅在于二者感知世界的方式:后者以真实世界的车辆来感受,而前者单纯依靠数据的输入。
二、规模和质量是训练模型的核心
“特斯拉的数据来源于真实道路上搭载了传感器的车辆;而OpenAI的大量数据,从目前的公开信息来看,来源于网络。在质量的维度,特斯拉通过和Uber合作,获取‘五星司机’的素材训练FSD;而从规模出发,奥特曼最近希望筹集万亿美元规模的资金,就是注重计算力和规模的表现”[1]。
三、对计算资源的巨大需求
AI发展需要巨大的计算资源。
黄仁勋认为,“计算机架构在不断进步,如果不将‘计算机变得更快’纳入考量,那么我们可能需要4个太阳,才能为这一切提供燃料。”因此,芯片行业必须朝着更好、更具成本效益的方向前进,以降低AI技术的成本。
英伟达的AI GPU的交付周期,从去年底的8-11个月缩短到了目前的3-4个月。最近两个月,英伟达的股价上涨46%,总市值达到1.8万亿美元,超过Google和Amazon,仅次于微软和苹果。
OpenAI似乎有意与英伟达竞争。萨伊.奥特曼正在中东筹集资金,以支持OpenAI的一项半导体计划。
四、带来的挑战
1. 虚假视频
现在的解决做法是发布者在AI生产的内容上打水印,告知用户。如何识别不同平台生产的AI内容,还是一大难点。
参考资料
1. "Sora证明马斯克是对的,但特斯拉和人类可能输了",微信公众号:极客公园(ID: geekpark),作者:曹思颖.
2. “春节‘科技七巨头’市值排位洗牌:英伟达狂飙至第三”,微信公众号:时代周报(ID: timeweekly),作者:郭美婷.