这两年,具身智能的进展让人目不暇接。从特斯拉人形机器人 Optimus 在舞池跳舞,到宇树 Unitree H1 机器人在春晚扭秧歌,再到智元机器人灵犀 X2 骑自行车......这些场景不断刷新着大众对智能机器人的认知,也展示了它们在现实世界中的适应能力。但一个耐人寻味的现象是,每次成为焦点的,几乎都是人形机器人。
为什么“人形”成为关注焦点?这或许可以从科技巨头的布局中找到答案。
今年 1 月,英伟达 CEO 黄仁勋在采访时表示:“通用人形机器人技术将最为实用,因为我们的世界是围绕人类需求建造的。” 他坦言,实现这一目标极具挑战,但随着 Transformer、大型语言模型(LLM)及基础模型的突破,已让通用机器人迈入可能实现的阶段。短短两个月后,在 GTC 大会上,他直言直:“通用机器人时代已经到来。”
与此同时,特斯拉 CEO 埃隆·马斯克也在 CES 2025 上做出过大胆预测:人形机器人将成为“史上最大产品”,全球或将需要 300 亿台,远超任何其他产品。
其实从本质上看,具身智能指的是“有身体的智能”,其核心在于智能决策与物理世界的深度融合。人形机器人之所以成为当前最受关注的具身智能形态,主要因为它们契合人类社会的环境需求——建筑、工具、交互方式,几乎所有基础设施都围绕人类身体设计。从适配性的角度来看,人形机器人无疑具有天然优势。因此,不止英伟达、特斯拉,OpenAI 也在今年首次开放机器人硬件相关职位招聘,苹果、Meta 以及华为、比亚迪、小米、小鹏、 vivo 等国内多家科技公司和 AI 实验室也纷纷布局机器人赛道,市场对其期待可见一斑。
然而,人形机器人真的等于具身智能的终极形态吗? 要知道机器人不仅要理解世界,还必须能够自主决策并执行任务,如自主移动、语音交互和环境适应。这意味着,它们不能停留在“炫技”阶段,而要具备真正的实用价值。问题是,人形机器人能否真正能走入千行百业,甚至千家万户?具身智能的未来是否完全依赖 AI 大模型?我们距离真正的通用机器人仍然存在哪些关键技术瓶颈?又该如何去发力?
3 月 28 日 19:30,CSDN《万有引力》栏目特别邀请到北京邮电大学人工智能学院副教授陈光(@爱可可-爱生活)、深圳市人工智能与机器人研究院副研究员夏轩、Roboraction.AI 首席执行官黄浴,在 CSDN &《新程序员》执行总编、《万有引力》主理人唐小引主持下,以“十问具身智能”为切入点,深入探讨当前具身智能技术最新进展、核心挑战与未来方向,共同探索通用机器人的真正边界!
本次的话题将围绕以下几大方向展开:
通用机器人时代已经来临?
具身智能一定要是人形机器人吗?
直击具身智能痛点:数据瓶颈、计算瓶颈、模型架构
具身多模态大模型进行时,通用机器人大模型路在何方?
具身智能应用,什么落地最快?
人形机器人的开发重点与下一个突破
对于具身智能,开发者需要重点关注什么?
欢迎大家扫码预约直播,锁定本场“具身智能”主题的直播。
届时,如果你对具身智能有任何疑问,也可在直播间留言互动!
嘉宾介绍
陈光@爱可可-爱生活,北京邮电大学人工智能学院副教授
主要研究方向是文本计算和具身智能等。拥有多项发明专利,主持、参与国家重大专项、核高基、国家863、国家自然科学基金等多项国家级项目,在国际高水平期刊和学术会议发表论文数十篇。创办微博账号“爱可可-爱生活”,聚焦人工智能主题,以专业的学术品位、广阔的领域视野、敏锐的业界观察、丰富优质的资源推荐,为广大人工智能、机器学习和数据科学爱好者所熟悉和喜爱。多次在团中央、发改委等企事业单位作大模型和人工智能报告,是人民网“全国大学生同上一堂人工智能大课”主讲专家。著有《DeepSeek全攻略》、《走进具身智能》等广受欢迎的科普书。
夏轩,深圳市人工智能与机器人研究院副研究员
2017年博士毕业于上海交通大学。现为深圳市人工智能与机器人研究院副研究员,深圳市高层次人才。主要进行具身智能、多模态学习、缺陷检测、生成模型等方面的研究。主持国家自然科学基金项目、广东省自然科学基金项目、中国博士后科学基金项目,参与多项国家、省、市基金项目以及多个企业联合项目。发表论文二十余篇,申请发明专利十余项。
黄浴,Roboraction.AI首席执行官
之前曾担任SAIC Zone Tech的首席自动驾驶科学家,上海大学的客座教授,Black Sesame Technology的自动驾驶研究副总裁,Singulato USA的董事长。曾在百度美国、英特尔(圣何塞)、三星电子美国以及Futurewei Technologies Inc.工作过。2024年,受邀成为IEEE/CVF 2024冬季计算机视觉应用会议(WACV'24)在美国夏威夷举行的首届大型语言与视觉模型在自动驾驶中的应用研讨会(LLVM-AD)的主题演讲嘉宾。2020年,我被亚太信号与信息处理协会(APSIPA)评选为杰出工业领袖。2019年,被选为IEEE国际多媒体信息处理与检索会议(MIPR'19)在加利福尼亚州圣何塞举办的“迈向自动驾驶”创新论坛的主持人。在国际会议和期刊上发表了超过40篇学术论文,在美国和欧洲获得了18项专利,并出版了一本名为《自动驾驶系统开发》(中文版)的书籍。在西安交通大学、西安电子科技大学和北京交通大学获得了学士、硕士和博士学位。同时,他还是AvH(Alexander von Humboldt)研究学者(德国)以及UIUC贝克曼研究所的博士后研究员。
唐小引,CSDN&《新程序员》执行总编、《万有引力》主理人
3 月 28 日晚 7:30 点,锁定直播,线上相聚互动讨论, 揭秘具身智能背后的奥秘!
关于《万有引力》:
这是由 CSDN&《新程序员》执行总编唐小引主理的对话栏目。技术趋势多变,一不留神总担心错过。正在发生的技术事件,对于我们开发者意味着什么?我们面临的诸多困惑从何寻找答案?《万有引力》即志在于此,直面事件与困惑,抽丝剥茧,解读技术真相。
栏目定位:一档面向开发者群体,聚焦解读技术事件的对话直播栏目。
直播观看平台:CSDN 视频号、CSDN 网站&App
多形式:文章、视频、音频都会有,持续关注 CSDN 公众号都可获取。目前《万有引力》栏目已上线小宇宙平台,欢迎大家关注!
4 月 18-19 日,由 CSDN&Boolan 联合举办的 2025 全球机器学习技术大会(ML-Summit 2025)将在上海虹桥西郊庄园丽笙大酒店隆重举行。大会云集院士、顶尖学者、IEEE Fellow、一线科技企业技术实战专家组成的超 50 位重磅嘉宾。他们将以独特的视角,解读智能体、联邦学习、多模态大模型、强化学习等覆盖 AI 当下热门的技术实践专题。