端到端自动驾驶与通用机器人

端到端自动驾驶与通用机器人

引言

一直以来,自动驾驶和机器人是紧密相关相互借鉴和启发的两个行业,本文将讨论自动驾驶早期发展与机器人的历史渊源,以及近年来自动驾驶端到端技术可能对机器人行业的启发;最后,我们将呈现关于物理世界AGI的实现路径的不同观点。

阶段一:机器人赋能自动驾驶早期的发展

自动驾驶的早期发展过程中,借鉴了大量机器人技术的积累。这些借鉴不仅体现在传感器的使用上,还包括感知算法、规划算法、中间件等多个层面。

自动驾驶系统大量依赖激光雷达、摄像头和超声波传感器,这些传感器技术最初在机器人领域得到了广泛应用和成熟。机器人使用这些传感器来感知环境、避障和定位。例如,激光雷达在机器人导航中的应用可以追溯到20世纪80年代末和90年代初,麻省理工学院(MIT)和卡内基梅隆大学(CMU)的研究人员在那个时期开始将激光雷达应用于机器人系统中。2004年美国国防部举办的DARPA无人驾驶挑战赛上,激光雷达首次被应用于自动驾驶汽车。

感知算法方面,SLAM(Simultaneous Localization and Mapping)技术是机器人自主导航的核心技术之一,允许机器人在未知环境中实时构建地图并确定自身位置。自动驾驶系统借鉴SLAM技术,实现高精度地图构建和车辆定位。例如,百度的Apollo自动驾驶平台利用SLAM技术构建高精度地图,提供车辆定位和导航支持。这种技术的应用提高了自动驾驶系统在复杂城市环境中的导航能力。

路径规划算法方面,目前广泛应用于自动驾驶行业的经典算法A和Dijkstra算法均来自于机器人行业。例如,Waymo的自动驾驶系统便用了一种改进的A算法,能够在复杂城市环境中计算出最优驾驶路径,同时避开交通拥堵和事故区域。

中间件在机器人系统中用于实现不同模块之间的数据通信和协调。自动驾驶系统借鉴这一概念,通过中间件实现各子系统的高效协同。ROS(Robot Operating System)是机器人领域的标准中间件,许多自动驾驶系统在开发初期都使用ROS进行原型设计和测试。

阶段二:自动驾驶产业化加速,端到端技术可反哺机器人

2015年以来自动驾驶技术快速发展,叠加近几年来智能电动汽车在乘用车消费市场的渗透率跨越鸿沟,带动了自动驾驶产品真正迈向大规模应用,而这一阶段机器人行业没有出现类似的规模化应用。

除成本因素外,机器人最大的问题是智能化、通用性不足。传统的机器人受限于算法能力,并不具备智能化的理解、交互能力。其中智能化和通用化程度最低的代表是工业机械臂,其操作基本都基于固定运动轨迹编程,每次切换应用场景和操作的产品都需要重新编程;随着机器人算法的进步,也逐渐发展出一些“清洁机器人”、“物流机器人”等细分赛道,但目前这类产品有明确的功能属性和应用场景范围,智能化和通用化程度有待提升。

不过,机器人和自动驾驶技术的基本架构有一定通用性,自动驾驶端到端代表的数据驱动学习范式同样可以应用于机器人。端到端相比基于规则的经典算法的转变,在机器人领域的重要性甚至超过自动驾驶。

图片

清华大学交叉信息研究院赵行教授表示:“传统的自动驾驶技术方案很难解决机器人的问题,以感知能力为例,自动驾驶系统运行的道路环境最主要的元素是车辆、行人、车道等,在经典算法架构下以目标检测、车道线检测等任务的形式表达可以解决大部分问题;而机器人可能产生互动的环境要素过于多样,例如家用机器人可能需要与数据线等特殊几何形态物体、流体等难以简单表征的元素交互。因此传统感知和规控方案无法用于通用机器人。相比之下,数据驱动和AI是对机器人更重要的思路。”

基于以上背景,自动驾驶端到端已经提供了一种可供参考、可量产的数据统计技术范式。自动驾驶端到端的探索不仅会从算法和模型架构上启发机器人采用数据驱动技术范式,同样也为通用机器人如何构建数据获取路径和算力等数据基建提供了参考。

阶段三:自动驾驶和机器人竞逐物理世界AGI

随着大模型在2022年以来的快速发展,人们对通用人工智能的到来时间有了更乐观的预期。方舟资本发布的《Big Ideas for 2024》报告中指出,目前,通用人工智能预期实现的时间已经提前到2027-2031年。在这一语境下,AGI主要指的是语言大模型、多模态大模型等虚拟世界中的AGI。

图片

另一方面,当虚拟世界的AI已经展现出足够的智能化,人们自然而然想尝试将AI拓展到物理世界,从而引发了2023年以来“具身智能”领域的研究热潮。

在物理世界AGI/具身智能的语境下,端到端自动驾驶和通用机器人是这一研究范畴最重要的两个应用领域。阿里云智能集团副总裁季强在2024年3月的电动汽车百人会上提到“具车智能”概念,将具身智能与自动驾驶间做了概念上的关联。

虽然讨论“自动驾驶和通用人形机器人谁会率先实现物理世界AGI”这一问题并无现实价值,但无论哪个领域率先实现,支撑这一判断的考虑因素却可以给另一个领域带来启发。

图片

支持“通用人形机器人将会率先实现物理世界AGI”这一观点的事实主要是其安全性要求低于自动驾驶汽车,因而可能更容易达到可用状态——在大多数应用场景中,机器人主要面对的是静态的障碍物而非动态变化的环境,这种稳定的工作条件使得机器人有更多时间处理信息和进行深入推理,从而提高操作效率和减少意外。

这一观点对自动驾驶的后发是:反过来说,提高计算和响应的速度能够显著提高安全性,因此,更高效的计算平台、更灵敏的底盘执行器是加速自动驾驶应用的关键环节。

图片

支持“自动驾驶将会率先实现物理世界AGI”这样的观点的主要事实是:a.自动驾驶的场景相对结构化

自动驾驶汽车主要操作在相对可预测和规范化的环境中,如公路和城市街道。这些场景虽然复杂,但遵循一套明确的交通规则。

车辆的任务目标是明确的。相比之下,通用人形机器人面临的挑战则更为多样和复杂。人形机器人需要应用于多样的场景,如工厂、家庭、办公室或公共场所等,其对泛化能力的要求远高于自动驾驶汽车。鉴智机器人联合创始人、CTO都大龙提到,通用机器人必然将落地自动驾驶,因为自动驾驶有着最统一的场景需求,成有目前最成熟的传感器及执行器。

图片

这一观点对机器人的启发是:追求“一定范围下的通用”可能是机器人更务实的落地路径,参考L4级无人驾驶发展的经验教训,通用机器人也应当从特定场景开始应用,逐渐拓展至更广泛的场景。

b.通过影子模式获取海量数据的路径已经打通

Wayve AI CEO Alex Kendall在一篇文章中表示,数以百万辆计的汽车都配备了训练和部署具身智能所需的传感器和计算能力,这些汽车每天都在路上跑,这意味着与其他机器人应用不同,数据收集可以以较低的成本实现。这是Wayve认为自动驾驶将助推具身智能的发展的主要原因。另外,驾驶场景的数据同质性很高,这意味着每一辆车采集的数据在端到端的范式下是能够为训练后的模型应用起到重要作用的,但是机器人的应用场景多样,比如从工厂里拧螺丝到餐馆里洗盘子,每一个任务都可能需要不同的数据和数据处理方法,这样的数据异质性显著增加了技术实现的复杂度。

这一观点对人形机器人的启发是:需要找到一个可以快速形成数据反馈的场景和机制。目前,机器人的数据采集除了使用机器人直接采集外,还可以通过遥操作、动作捕捉等方式进行,但是其获取海量高质量数据的能力依然非常缺乏。

长期来看,仿真和合成数据是机器人获取数据的重要手段。

总的来说,随着AI技术的不断进步,自动驾驶和机器人技术的相互融合、相互借鉴将更加深入,共同推动AGI走向物理世界,创造更大社会价值。

AiFighing是全网第一且唯一分享自动驾驶实战,以代码、项目的形式讲解自动驾驶感知方向的关键技术,从算法训练到模型部署。

关注我的公众号auto_driver_ai(Ai fighting), 第一时间获取更新内容。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值