李飞飞的World Labs

AI教母李飞飞创业的消息

早已不是什么新闻了

不过大家一直没能打听到这家公司的具体业务

只知道它一直在融钱

李飞飞也一直藏着掖着

直到最近才公布了自家公司World Labs正式启动的消息

3个月之前,这家新晋AI独角兽

在完成了大约1亿美元的融资后

估值就已经达到10亿美金

就在前几天

World Labs又获得了2.3亿美金的新一轮融资

不仅由a16zNEARadical Ventures领投

还有英伟达的风投部门参与

甚至就连AI大牛杰弗里·辛顿杰夫·迪恩、谷歌的前CEO 埃里克·施密特、以及LinkedIn创始人里德·霍夫曼等人

都纷纷参与了投资

那他们到底是看上了这家公司的哪一点呢?

答案就是,空间智能

一直以来

World Labs成立后所专攻的领域

都被蒙上了一层神秘的面纱

如今,一切真相大白

根据World Labs的官方博客介绍

它的诞生就是为了构建「大世界模型」

Large World Model,简称LWM

通过感知来生成3D世界

并切与之进行交互

那么,究竟什么是空间智能呢?

今天,就从这个概念入手

带大家来看看AI教母李飞飞的初创公司

究竟在研究些什么

前段时间,李飞飞在一次活动中

首次详细揭秘了什么是「空间智能」

她将这个概念拆分成了三个短语

分别是视觉化为洞察

看见成为理解理解导致行动

这是什么意思呢?

李飞飞这样解释道

所有空间智能的生物所具备的行动能力

都是与生俱来的

因为,它能够将感知行动进行关联

如果想让AI超越它们自身当前的能力

我们需要的

不仅仅是一个能够看到、会说话的AI

而是一个可以行动的AI

她将智能总结为两大类

一是语言智能

另一个便是空间智能

虽然因为大语言模型的火爆

语言智能目前备受关注

但是空间智能作为人类智能的另一个重要组成部分

将来必然也会对AI产生重大的影响

此外,这两种智能也是相辅相成的

想要进一步提升AI的语言智能

就需要增强AI与人类的语言互动能力

而在所有语言互动中

最为基础的就是空间智能

正是由于这种智能的存在

我们才能够理解互动的对象是什么、在哪里

以及处于什么样地位

从而给出正确的语言反应

同时

空间智能还赋予了人类极强的创造力

可以让我们把脑海中的三维画面

通过空间感知的方式

用手呈现在纸面上

李飞飞表示,人类的空间智能

实际上是经过了数百万年的演化而来的

这是一种理解、推理、生成

甚至是在一个3D世界中互动的能力

无论是观赏一朵美丽的花朵

尝试触摸一只蝴蝶

还是去建造一座城市

所有这些都是空间智能的一种体现

那么

如何让计算机也具备空间智能的能力呢?

其实在这方面

我们已经取得了巨大的进步

在过去的几年里

AI在3D生成和视频生产领域的发展

都相当振奋人心

只需要一句提示

AI就能够轻松地生成各种图像和视频

这些模型已经在以全新的方式

重塑着人类的工作和生活方式

而我们仅仅还只是看到了

生成式AI革命前夜的第一章

如今面临的问题是

我们如何在3D领域取得更进一步的突破

自从2007年起

李飞飞等人基于超前的眼光创建了 ImageNet

一度帮助人工智能扭转了局面

ImageNet是一个定制的数字图像数据库

是如今测量图片类应用运行准度和效率的行业标杆

它催生出了一系列先进的神经网络

李飞飞认为

如果人工智能想要能够创造现实中的世界

无论是对现实的模拟还是完全想象的宇宙

今天的深度学习模型也需要类似的推动才行

而李飞飞正是为了寻找和ImageNet 一样

能够扭转乾坤的突破

所以才创办了World Labs

World Labs的目标,简而言之

就是构建具有空间智能的大世界模型LWM

让它可以感知、理解、推理

甚至生成3D世界

并且让人们能够与这个3D世界进行互动

多年以来

李飞飞一直对大世界模型抱有执着地追求

当大家都在为ChatGPT疯狂的时候

她和她的学生

也是World Labs的联合创始人之一的贾斯汀约翰逊

却在电话里兴奋地讨论着人工智能的下一次迭代

他们觉得

未来十年将是创造全新内容的时代

这些内容会将计算机视觉和深度学习

从虚拟的互联网世界

带入到真实的空间和时间中

从World Labs发布的公告来看

它的目标正如贾斯汀所说的那样

除了李飞飞以外

World Labs创始团队中的其他3人

也都是计算机视觉和图形学领域的技术专家

本·米尔登霍尔(Ben Mildenhall)

本科毕业于斯坦福大学的数学和计算机科学专业

博士毕业于加州大学伯克利分校

曾经在谷歌担任研究科学家

谷歌学术引用量超过2.3万

他博士期间师从Ren Ng

提出了著名的神经辐射场NeRF

而我们之前提到的

贾斯汀约翰逊Justin Johnson

在创业的同时还在密歇根大学担任助理教授

他本科毕业于加州理工学院的数学和计算机科学

博士毕业于斯坦福大学

李飞飞的学生

在博士期间

他曾经在谷歌、Facebook和雅虎实习

毕业后到Meta FAIR部门担任研究科学家

谷歌学术的引用量超过3.4万

他在读博期间发表的论文

《实时风格转换和超分辨率的感知损失(Perceptual Losses for Real-Time Style Transfer and Super-Resolution)》,

光是这一篇的引用量就超过了1.1万

最后是克里斯托夫·拉斯纳Christoph Lassner

他本科毕业于德国奥格斯堡大学的信息学专业

之后前往图宾根大学以及马克斯·普朗克Max Planck智能系统研究所

攻读博士学位

毕业之后

他曾经在Meta亚马逊担任研究科学家

之后在Epic Games领导研究团队

专注于图形学领域的3D重建3D渲染技术

除了这三位大佬

目前公司还有20名成员

不仅包括计算机视觉和图形学领域的顶尖研究人才

还有系统工程产品设计等职位

他们都致力于在空间智能的基础模型和产品之间

构建反馈闭环

从而尽快让产品落地、服务用户

World Labs的团队相信

随着时间的推移

AI领域将会出功能更加强大、能力更加广泛的世界模型

这种世界模型可以被应用在各种领域

与人们一起协同工作

实现真正的“通用智能”

李飞飞曾经表示

AI将会成为一项非常基础的技术

对广泛的使用场景产生影响

包括机器人和制造业

最近

对具身智能的关注也一直正在升温

很多人开始相信

使用大型世界模型进行训练

或许可以赋予机器人真正的“世界感”。

这确实也在 World Labs 的计划之中

但是距离成型

可能还需要一段时间

按照World Labs团队的预测

第一阶段的大世界模型

将会是构建一个对三维性、物理性以及空间和时间概念

有深刻理解的AI模型

接下来

这个模型将会支持增强现实技术

并且进军机器人领域

如果这个愿景得以实现

那么大世界模型将有助于改进自动驾驶汽车自动化工厂的生产效率

甚至可能推动类人机器人的发展

比方说

如果用户可以利用大模型来自定义物理变量

创建出一个虚拟的3D空间

那么这个功能将会为艺术家、设计师、开发者和工程师们

解锁更多的未知创意

甚至可能会制造出机器人艺术家

最终,生成式AI将从2D的像素平面

走向完整的3D世界

无论它是虚拟的还是现实的

这听起来似乎有些难以想象

但是World Labs之所以能吸引到这么多的大佬投资

其中一个重要原因

就是李飞飞对这个技术发展方向的预判

虽然前景可观

但是前路的路途上却依然困难重重

World Labs承诺会在 2025年推出产品

面对外媒连线记者的提问

World Labs 将如何盈利的时候

创始人李飞飞回应道

现在还只是刚起步

有很多边界需要突破

还有许多未知的问题需要去解决

当然,我们是全球最优秀的团队

能够解决这些未知问题

作为投资人之一的A16z 的合伙人马丁·卡萨多

则给出了更为具体的解释

他指出,像OpenAI的ChatGPT

或者AnthropicClaude 一样

模型本身就可以作为产品

作为一个供他人直接使用、或者托管其他应用程序的平台

潜在客户可能会包括游戏公司或者电影制片厂

当然

World Labs 也并不是唯一一家涉足所谓物理AI的公司

英伟达的CEO黄仁勋在今年的GTC大会上就曾经表示

为通用人形机器人构建基础模型

是当今AI领域最令人兴奋的方向之一

但是卡萨多坚持认为

World Labs的雄心、人才和愿景都是独一无二的

他说道,我已经做投资快10年了

这是我遇到过最强的团队,没有之一

风投机构支持自己的投资标的

并没有什么稀奇

但是卡萨多不仅仅是投入资金

自从成为World Labs投资人以来

他第一次作为被投公司的兼职团队成员

每周花一天时间在公司里

在李飞飞宣布成立创业公司之后

很多AI领域的知名学者都纷纷发来祝贺

其中也有很多是她的学生

OpenAI的创始成员之一、前特斯拉AI高级总监安德烈·卡帕西Andrej Karpathy 就是其中之一

他还特地发推文庆祝

说World Labs的团队是顶尖的

很期待看到他们将前沿研究应用到3D AI中

卡帕西还透露,在博士期间

自己与李飞飞贾斯汀·约翰逊一起

共同度过了很多美好的时光

当时,李飞飞是他的导师

也是他们“勇敢的领袖”,

而World Labs的另一位创始人贾斯汀

则和他一起撰写科研论文

这三位大佬一起

共同奠基了斯坦福最著名的课程之一

CS231n的第一个版本

CS231n课程全名为计算机视觉深度学习(Deep Learning for Computer Vision)

李飞飞在今年的春季学期

依旧开设了这门课

吴恩达的CS229一样

是很多AI从业者的启蒙课

此外

英伟达高级科学家Jim Fan也同样发推文

祝贺自己的博士生导师李飞飞成功创业

他在推文中表示

李飞飞在具身智能方面的观点

深刻影响了自己的博士阶段和研究品位

他相信

空间智能将是计算机视觉和具身智能体的下一个前沿方向

好了

以上就是对World Labs的简单介绍了

虽然被众多大佬看好

但是World Labs的大世界模型

真的会成为人工智能发展的下一个大方向吗?

我们或许还需要一些时间来证明

从某个角度来看

World Labs 的承诺与此前热炒过的概念

元宇宙,似乎有些接近

不过World Labs 的创始人认为

那场短暂的热潮来得太早

只是基于一些有前景的硬件

缺乏真正的互动内容,他们也暗示

世界模型或许能够成为这个问题的解决办法

而另一方面,在大模型技术爆发以后

大量新势力车企

已经开始把自动驾驶技术的方向转向世界模型与端到端方案

探索具身智能的机器人创业公司也在成批地出现

越来越多的实践正在告诉我们

新的方法已经展现出了跨越代际的优势

可以想象

在这些方向上,AI绝不会停滞不前

那大家对于李飞飞的World Labs有什么看法呢?

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值