AI恐怖体操视频腿脚乱飞、大变活人,LeCun:视频生成模型根本不懂物理

西风 发自 凹非寺
量子位 | 公众号 QbitAI

一段AI生成的体操视频,引发近百万网友围观,LeCun等一众大佬还因为它吵起来了。

4acd71d29ee8f89237d1083890809868.gif

体操表演,emmmm怎么不算呢?

20b96c5decdb50610a882306c6f1e636.gif

通过视频右上角的水印,此段视频正是由那个一度被认为是“下一代”文生视频的Dream Machine(来自Luma AI)生成的。

大伙儿看后纷纷坐不住,围绕此讨论的,是AI视频领域的一个熟悉的话题:AI是否理解物理规律

LeCun直接开麦:

视频生成模型不理解基本物理知识。更不用说人体了。

8eed1fad3a68da018cee5c9ff71bcba6.png

华盛顿大学计算机科学教授Pedro Domingos看后也“摇了摇头”:

AGI可能并不会像一些人预期的那样即将到来。

727153005d3526be56cd6b5fe43c35bd.png

畸变雀食离谱

自Sora问世以来,“AI是否理解物理规律”这个话题就被越来越多人关注。

下面这段Sora生成的“寄居蟹用灯泡当外壳的夜间场面”是个经典的例子,海浪与沙滩的互动非常细腻,寄居蟹腿上的纤毛也活灵活现。

f397b2e66062248d6a3fd5f48378e988.gif

对比真实拍摄的类似场景照片,也就灯泡没有电源不应该亮这一个明显破绽了。

63bbe2b5c3f14c3b096764653fc3ae88.png

最近Luma AI的Dream Machine也一样,生成的第一视角探废弃房子真实感拉满:

b2b7bed09d925500e873e16b994f4177.gif

由此,不少人认为Sora、LUMA等的视频生成模型已经理解了简单的物理规律。

然鹅,这次被放出的视频着实有点太离谱。

不仅腿脚乱飞,频频上演大变活人:

8efcf3ce4cd8fd2e073271af653830ec.gif

就这高难度的空中悬浮翻跟头,也是牛顿都要被气活了的节奏:

a38f7dba94976d10d9d6e6d6d502756e.gif

以至于网友看后还表示,说恐怖大可不必,说搞笑还差不多。

83ea364567bede57b754d2f401899334.gif

‍‍如此抽象,LeCun直接评论视频生成模型不会懂物理。

他还进一步解释,Sora或者其它视频生成模型都有类似的问题,视频生成技术无疑也肯定会随时间推移而进步。

但:

真正理解物理的学习系统并不会具有生成性。就像鸟类、哺乳动物等比任何视频生成系统更了解物理。然而,它们都不能生成详细的视频。

b7c66e73e805053742ac4e3964080357.png

类似还有另一种思考:

即使AI视频生成模型之后会进化的很好,生成的视频质量“完美”,那么就意味着它理解物理了?

4f13e1cbe1497d33cd6b1ba7afe4cca8.png

LeCun等的观点,立马引起网友的质疑:

鸟和哺乳动物也会生成详细的视频,只不过是在大脑中生成无法将其具像化。

35e20373158b8d2740a2ba881653fe07.png

然鹅,这种反驳并未说服LeCun。

78e383ed2786a1bd6221156c1cc19af7.png

此外,还有不少人持反对意见。

例如,谷歌DeepMind/Brain团队研究员Lucas Beyer就指出:

这就像是展示一个由几年前的Dall·E mini生成的图像,然后称当前的图像生成方式注定失败一样。

毕竟,之前生图模型生成的图像be like:

44e23999f09b033cb74859165ff5ed07.png

至于模型会生成如此离谱的视频?

有网友认为是缺乏体操表演数据,还有网友认为是身体部位的模糊处理,使得模型无法理解人体结构,继而不能保证肢体动作的连贯性。

20b22ce69a798f9deccbe57a1bc043fe.png

视频生成在计算上更为复杂,并且具有高度的上下文相关性,对详细标注的训练数据有更大的需求,这些需求现在还未得到充分满足。

db6e14e2b80f7923ff6326ea832b7545.png

前段时间SD 3翻车,同样对人体生成效果不好,网友也讨论过这一问题,过于严格的数据审核,可能误删了一些无害的成人图像,影响了模型对人体结构的理解。

de1c3dab276f1bf3f7fae30882499b29.png

One More Thing

除了Luma AI的Dream Machine生成体操视频大翻车,Runway的Gen-3也……

eb22050450b60716533d4e56d25b6c69.png

同款三头六臂:      

fb09aa823498b5e88c4f9ae8c6dd60fb.gif

同款空中悬浮绝活:

593f75507ef384ab4e2375577442ed56.gif

参考链接:
[1]https://x.com/ylecun/status/1807497091964449266
[2]https://x.com/giffmana/status/1807511985807908926
[3]https://x.com/EricDai_BioE/status/1807540558216454281
[4]https://x.com/Grady_Booch/status/1807556807982010451

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值