AI教母李飞飞创业的消息
早已不是什么新闻了
不过大家一直没能打听到这家公司的具体业务
只知道它一直在融钱
李飞飞也一直藏着掖着
直到最近才公布了自家公司World Labs
正式启动的消息
3个月之前,这家新晋AI独角兽
在完成了大约1亿美元
的融资后
估值就已经达到10亿美金
就在前几天
World Labs
又获得了2.3亿美金
的新一轮融资
不仅由a16z
、NEA
和Radical Ventures
领投
还有英伟达
的风投部门参与
甚至就连AI大牛杰弗里·辛顿
、杰夫·迪恩
、谷歌的前CEO 埃里克·施密特
、以及LinkedIn创始人里德·霍夫曼
等人
都纷纷参与了投资
那他们到底是看上了这家公司的哪一点呢?
答案就是,空间智能
一直以来
World Labs成立后所专攻的领域
都被蒙上了一层神秘的面纱
如今,一切真相大白
根据World Labs的官方博客介绍
它的诞生就是为了构建「大世界模型」
,
Large World Model
,简称LWM
通过感知来生成3D世界
并切与之进行交互
那么,究竟什么是空间智能呢?
今天,就从这个概念入手
带大家来看看AI教母李飞飞
的初创公司
究竟在研究些什么
前段时间,李飞飞
在一次活动中
首次详细揭秘了什么是「空间智能」
。
她将这个概念拆分成了三个短语
分别是视觉化为洞察
看见成为理解
,理解导致行动
这是什么意思呢?
李飞飞
这样解释道
所有空间智能的生物所具备的行动能力
都是与生俱来的
因为,它能够将感知
与行动
进行关联
如果想让AI超越它们自身当前的能力
我们需要的
不仅仅是一个能够看到、会说话的AI
而是一个可以行动的AI
她将智能总结为两大类
一是语言智能
另一个便是空间智能
虽然因为大语言模型的火爆
语言智能
目前备受关注
但是空间智能
作为人类智能的另一个重要组成部分
将来必然也会对AI产生重大的影响
此外,这两种智能也是相辅相成的
想要进一步提升AI的语言智能
就需要增强AI与人类的语言互动能力
而在所有语言互动中
最为基础的就是空间智能
正是由于这种智能的存在
我们才能够理解互动的对象是什么、在哪里
以及处于什么样地位
从而给出正确的语言反应
同时
空间智能还赋予了人类极强的创造力
可以让我们把脑海中的三维画面
通过空间感知的方式
用手呈现在纸面上
李飞飞表示,人类的空间智能
实际上是经过了数百万年的演化而来的
这是一种理解、推理、生成
甚至是在一个3D世界中互动的能力
无论是观赏一朵美丽的花朵
尝试触摸一只蝴蝶
还是去建造一座城市
所有这些都是空间智能的一种体现
那么
如何让计算机也具备空间智能的能力呢?
其实在这方面
我们已经取得了巨大的进步
在过去的几年里
AI在3D生成和视频生产领域的发展
都相当振奋人心
只需要一句提示
AI就能够轻松地生成各种图像和视频
这些模型已经在以全新的方式
重塑着人类的工作和生活方式
而我们仅仅还只是看到了
生成式AI革命前夜的第一章
如今面临的问题是
我们如何在3D领域取得更进一步的突破
自从2007年起
李飞飞
等人基于超前的眼光创建了 ImageNet
一度帮助人工智能扭转了局面
ImageNet
是一个定制的数字图像数据库
是如今测量图片类应用运行准度和效率的行业标杆
它催生出了一系列先进的神经网络
李飞飞认为
如果人工智能想要能够创造现实中的世界
无论是对现实的模拟还是完全想象的宇宙
今天的深度学习模型也需要类似的推动才行
而李飞飞正是为了寻找和ImageNet 一样
能够扭转乾坤的突破
所以才创办了World Labs
World Labs的目标,简而言之
就是构建具有空间智能的大世界模型LWM
让它可以感知、理解、推理
甚至生成3D世界
并且让人们能够与这个3D世界进行互动
多年以来
李飞飞一直对大世界模型抱有执着地追求
当大家都在为ChatGPT疯狂的时候
她和她的学生
也是World Labs的联合创始人之一的贾斯汀约翰逊
却在电话里兴奋地讨论着人工智能的下一次迭代
他们觉得
未来十年将是创造全新内容的时代
这些内容会将计算机视觉和深度学习
从虚拟的互联网世界
带入到真实的空间和时间中
从World Labs发布的公告来看
它的目标正如贾斯汀
所说的那样
除了李飞飞
以外
World Labs创始团队中的其他3人
也都是计算机视觉和图形学领域的技术专家
本·米尔登霍尔(Ben Mildenhall)
本科毕业于斯坦福大学的数学和计算机科学专业
博士毕业于加州大学伯克利分校
曾经在谷歌担任研究科学家
谷歌学术引用量超过2.3万
他博士期间师从Ren Ng
提出了著名的神经辐射场NeRF
而我们之前提到的
贾斯汀约翰逊Justin Johnson
在创业的同时还在密歇根大学
担任助理教授
他本科毕业于加州理工学院
的数学和计算机科学
博士毕业于斯坦福大学
是李飞飞
的学生
在博士期间
他曾经在谷歌、Facebook和雅虎实习
毕业后到Meta FAIR
部门担任研究科学家
谷歌学术的引用量超过3.4万
他在读博期间发表的论文
《实时风格转换和超分辨率的感知损失(Perceptual Losses for Real-Time Style Transfer and Super-Resolution)》,
光是这一篇的引用量就超过了1.1万
最后是克里斯托夫·拉斯纳Christoph Lassner
他本科毕业于德国奥格斯堡大学
的信息学专业
之后前往图宾根大学
以及马克斯·普朗克Max Planck智能系统研究所
攻读博士学位
毕业之后
他曾经在Meta
和亚马逊
担任研究科学家
之后在Epic Games
领导研究团队
专注于图形学领域的3D重建
和3D渲染技术
除了这三位大佬
目前公司还有20名成员
不仅包括计算机视觉和图形学领域的顶尖研究人才
还有系统工程
、产品设计
等职位
他们都致力于在空间智能的基础模型和产品之间
构建反馈闭环
从而尽快让产品落地、服务用户
World Labs
的团队相信
随着时间的推移
AI领域将会出功能更加强大、能力更加广泛的世界模型
这种世界模型可以被应用在各种领域
与人们一起协同工作
实现真正的“通用智能”
。
李飞飞曾经表示
AI将会成为一项非常基础的技术
对广泛的使用场景产生影响
包括机器人和制造业
最近
对具身智能的关注也一直正在升温
很多人开始相信
使用大型世界模型进行训练
或许可以赋予机器人真正的“世界感”。
这确实也在 World Labs 的计划之中
但是距离成型
可能还需要一段时间
按照World Labs团队的预测
第一阶段的大世界模型
将会是构建一个对三维性、物理性以及空间和时间概念
有深刻理解的AI模型
接下来
这个模型将会支持增强现实技术
并且进军机器人
领域
如果这个愿景得以实现
那么大世界模型将有助于改进自动驾驶汽车
、自动化工厂
的生产效率
甚至可能推动类人机器人的发展
比方说
如果用户可以利用大模型来自定义物理变量
创建出一个虚拟的3D空间
那么这个功能将会为艺术家、设计师、开发者和工程师们
解锁更多的未知创意
甚至可能会制造出机器人艺术家
最终,生成式AI将从2D的像素平面
走向完整的3D世界
无论它是虚拟的还是现实的
这听起来似乎有些难以想象
但是World Labs之所以能吸引到这么多的大佬投资
其中一个重要原因
就是李飞飞对这个技术发展方向的预判
虽然前景可观
但是前路的路途上却依然困难重重
World Labs承诺会在 2025年推出产品
面对外媒连线记者的提问
World Labs 将如何盈利的时候
创始人李飞飞回应道
现在还只是刚起步
有很多边界需要突破
还有许多未知的问题需要去解决
当然,我们是全球最优秀的团队
能够解决这些未知问题
作为投资人之一的A16z
的合伙人马丁·卡萨多
则给出了更为具体的解释
他指出,像OpenAI的ChatGPT
或者Anthropic
的Claude
一样
模型本身就可以作为产品
作为一个供他人直接使用、或者托管其他应用程序的平台
潜在客户可能会包括游戏公司或者电影制片厂
当然
World Labs 也并不是唯一一家涉足所谓物理AI的公司
英伟达的CEO黄仁勋
在今年的GTC大会上就曾经表示
为通用人形机器人构建基础模型
是当今AI领域最令人兴奋的方向之一
但是卡萨多
坚持认为
World Labs
的雄心、人才和愿景都是独一无二的
他说道,我已经做投资快10年了
这是我遇到过最强的团队,没有之一
风投机构支持自己的投资标的
并没有什么稀奇
但是卡萨多
不仅仅是投入资金
自从成为World Labs投资人以来
他第一次作为被投公司的兼职团队成员
每周花一天时间在公司里
在李飞飞宣布成立创业公司之后
很多AI领域的知名学者都纷纷发来祝贺
其中也有很多是她的学生
OpenAI的创始成员之一、前特斯拉AI高级总监安德烈·卡帕西Andrej Karpathy
就是其中之一
他还特地发推文庆祝
说World Labs的团队是顶尖的
很期待看到他们将前沿研究应用到3D AI中
卡帕西还透露,在博士期间
自己与李飞飞
和贾斯汀·约翰
逊一起
共同度过了很多美好的时光
当时,李飞飞
是他的导师
也是他们“勇敢的领袖”,
而World Labs的另一位创始人贾斯汀
则和他一起撰写科研论文
这三位大佬一起
共同奠基了斯坦福最著名的课程之一
CS231n
的第一个版本
CS231n课程全名为计算机视觉深度学习(Deep Learning for Computer Vision)
李飞飞在今年的春季学期
依旧开设了这门课
和吴恩达的CS229
一样
是很多AI从业者的启蒙课
此外
英伟达高级科学家Jim Fan
也同样发推文
祝贺自己的博士生导师李飞飞
成功创业
他在推文中表示
李飞飞在具身智能方面的观点
深刻影响了自己的博士阶段和研究品位
他相信
空间智能将是计算机视觉和具身智能体的下一个前沿方向
好了
以上就是对World Labs的简单介绍了
虽然被众多大佬看好
但是World Labs的大世界模型
真的会成为人工智能发展的下一个大方向吗?
我们或许还需要一些时间来证明
从某个角度来看
World Labs 的承诺与此前热炒过的概念
元宇宙,似乎有些接近
不过World Labs 的创始人认为
那场短暂的热潮来得太早
只是基于一些有前景的硬件
缺乏真正的互动内容,他们也暗示
世界模型或许能够成为这个问题的解决办法
而另一方面,在大模型技术爆发以后
大量新势力车企
已经开始把自动驾驶技术的方向转向世界模型与端到端方案
探索具身智能的机器人创业公司也在成批地出现
越来越多的实践正在告诉我们
新的方法已经展现出了跨越代际的优势
可以想象
在这些方向上,AI绝不会停滞不前
那大家对于李飞飞的World Labs
有什么看法呢?