端到端自动驾驶主要玩家

1、主机厂

小鹏汽车

2024年5月20日,小鹏汽车举办AIDay发布会,董事长、CEO何小鹏宣布端到端大模型上车。小鹏的端到端大模型有三个组成部分:神经网络XNet+控大模型XPlanner+大语言模型XBrain。小鹏汽车在发布会上表示,端到端大模型上车后,18个月内小鹏智能驾驶能力将提高30倍,每2天内部将做次智驾模型的送代。

图片

鸿蒙智行(类主机厂)

2024年4月24日,华为智能汽车解决方案发布会上,华为发布了以智能驾驶为核心的全新智能汽车解决方案品牌一一乾崑,并发布了并发布了ADS3.0。乾崑ADS3.0的技术架构,感知部分采用GOD(GeneralObjectDetection,通用障碍物识别)的大感知网络,决策规划部分采用PDP(Prediction-Decision-Planning,预测决策规控)网络实现预决策和规划一张网。ADS3.0在ADS2.0基础上实现了决策规划的模型化,为端到端架构的持续演进莫定了基础。

图片

蔚来汽车

蔚来在高阶辅助驾驶研发领域一直保持领先。据晚点Auto报逆,自2023年下半年开始,蔚来已经投入几十人团队研发端到端自动驾驶,并计划于2024年上半年上线基于端到端的主动安全功能。蔚来智能驾驶研发副总裁任少卿认为,自动驾驶的大模型需要拆解成若干个层级,第二步是模型化,行业基本已经完成了感知的模型化,但是规控的模型化方面头部公司也没有完全做好,第二步是端到端,去掉不同模块间人为定义的接口,第三步是大模型。

零一汽车

零一汽车是一家新能源重卡科技公司。零一致力于在核心动力总成、集成式热臂理、自动驾驶技术等核心系统上实现全裁自研,并通过软件定义硬件,利用数据和技术重构供应链,实现自主安全可控与结构性成本优化。2024年5月,零一汽车成功发布了两款量产纯电牵引车"惊整与“小满"。

近期,零一也推出了基于大模型的端到端自动驾驶系统。整个系统使用摄像买和导航信息作为输人,经过多模态大诺言模型的解码产生规控信号和辑推理信息,将系统复杂度降低90%。通过模拟人类的驾驶行为与思考过程,模型在仅使用视觉信息的情况下展现了丰常强的泛化能力,并在多个数据集中获得世界第一的成绩。零一计划在2024年底实现端到端自动驾驶的部署上年,2025年在商用年与乘用车平合上同时实现量产,并计划于2026年实现高阶自动驾驶的大规模商业化运营。

图片

2、自动驾驶算法和系统公司

元戎启行

2023年3月,元戎启行推出国内首款不依赖高精度地图、可实现全域点到点功能的高阶智能驾驶解决方案DeepRoute-Driver3.0。DeepRoute-Driver3.0发布的同时,元我启行已经在进行端到端模型研发。2023年8月,元戎启行运用端到端模型完成了道路测试。在道路测试中端到端模型表现惊艳,该车会顾虑后车需求主动礼让后车。在路况复杂的城中村狭窄路段,搭载端到端模型的车辆行驶流畅,无顿挫感;在2024年4月25日的北京车展上,元戎启行对外展示了即将量产的高阶智驾平台DeepRouteIO以及基于DeepRouteIO的端到端解决方案。该方案采用NVIDIADRIVEOrin-X系统级芯片,200+TOPS算力,并配备1颗固态激光雷蕾达,11颗摄像头。元戎启行CEO周光在2024年GTC大会上表示:“未来人工智能技术将在物理世得到产泛应用。端到端模型会重塑物理世界的人工智能技术,终结一个以“规则驱动,为主导的原始人工智能时代,开启一个以深度学习,为引擎的通用人工智能时代。

图片

商汤绝影

2024年4月举办的北京车展上,商汤绝影推出面向量产的端到端自动驾驶解决案“UniAD”。本次车展上,商汤绝影展示的端到端自动驾驶系统,无需高精度图通过数据学习和驱动就可以像人一样观察并理解外部环境,然后基于足够丰富的感信息,UniAD能够自己思考并作出决策,像人一样开车,流畅进行无保护左转、快通行人车混行的红绿灯路口,自主解决各种高难度的城市复杂驾驶场景。

商汤的“端到端UniAD”归属于“模块化端到端”类型,与决策规划模型化的技术架构(即两段式端到端网络”)相比,不需要对感知数据进行抽象和逐级传递,实现了感知决策一体化和系统的联合优化。同时,商汤绝影也发布了其下代自动驾驶技术DriveAGI,即基于多模态大模型对端到端智驾方案进行改进和升级的“OneModel端到端”。

图片

小马智行

基于此前在模块化自动驾驶技术上的深远积累和技术优势,小马智行开始研发端到端自动驾驶模型为自动驾驶更大范围使用、更快覆盖速度做准备。2023年8月,小马智行将感知、预测、规控三大传统模块打通,统一成端到端自动驾驶模型,自前已同步搭载到L4级自动驾驶出租车和L2级辅助驾驶乘用车。
智行端到端自动驾驶模型既可作为L4级车辆的冗余系统,也可作为L2级车辆的解决方案。
小马智行端到端自动驾驶模型具有四大优势:一、多维度的数据来源:L4级自动驾驶车辆行驶数据,L2级量产车中人类驾驶员数据,V2X路段摄像头数据,日常生活中的数据等都可作为数据来源;二、全面的数据处理工具:基于在L4级自动驾驶上的多年积累,小马智行已拥有一套完整的数据评估体系,包含前期高质量数据挖掘清洗,测试使用的大规模仿真系统等;三、模型具有可解释性,不再是黑盒状态:小马智行结合驾驶意图、应用场景融入规则性指令,例如交通法规、驾驶偏好等;四、出色安全的驾驶技术:小马智行自动驾驶测试里程已达到3500万公里,安全性比人类司机高10倍;不仅向不同场景中的优秀人类驾驶员学习,还帮助其他驾驶员减少错误,从而提高我们自身的安全性。

鉴智机器人

在2024北京车展期间,鉴智机器人联合创始人、CCTO都大龙表示,鉴智机器人原创的自动驾驶端到端模型GraphAD已经可量产部署,并正与头部车企进行联合开发。在主流端到端开环规划评测上,GraphAD在各项任务上均达到领域最佳性能,规划任务上拟合误差和避障指标更是远超此前的最佳方案。

图片

英伟达

作为AI生态赋能者,英伟达可以提供从芯片、工具链到智驾解决方案的全栈产品,将AI领域最前端的技术赋能至智驾。
2023年夏季,吴新宙加盟英伟达成为汽车业务负责人。此后,英伟达加大对智驾业务的投入,强化英伟达对于自身全栈软硬件方案提供商的定义。
2024北京车展前夕,吴新宙展示了英伟达自动驾驶业务从L2到L3的发展规划,其中提到规划的第二步为“在L2++系统上达成新突破,LLM(Large Language Model,大语言模型)和VLM(Visual Language Model,视觉语言模型)大模型上车,实现端到端的自动驾驶”。吴新宙认为,端到端是自动驾驶的最终一步,接下来几年端到端模型和原有模型会在自动驾驶中相辅相成,端到端模型提供更拟人且灵活的处理,而原来的模型和方法则可以保证安全性。

地平线

地平线早在2016年便率先提出了自动驾驶端到端的演进理念,并持续取得技术创新与突破:在2022年提出行业领先的自动驾驶感知端到端算法Sparse4D;2023年,由地平线学者一作发表的业界首个公开发表的端到端自动驾驶大模型UniAD,荣获CVPR2023最佳论文。同时,地平线积累了基于交互学习的端到端深度学习算法,大幅提升智驾系统在复杂交通环境中的通过率、安全性和舒适度。在硬件技术上,地平线专为大参数Transformer而生的新一代智能计算架构BPU纳什,能够以高度的软硬协同打造业界领先的计算效率,为自动驾驶端到端和交互学习提供智能计算最优解。

图片

3、自动驾驶生成式AI公司

光轮智能

光轮智能致力于为企业落地AI提供合成数据解决方案,结合生成式AI和仿真技术,
为行业提供多模态、高真实度、可泛化、全链路的合成数据。解决自动驾驶、具身
智能行业中真实数据采集难、CornerCase数据缺乏、标注成本高、回环周期长、利用率低等问题。
光轮智能由谢晨博士创立,结合生成式AI和仿真技术提供合成数据解决方案。谢晨曾在英伟达(美国)、Cruise(美国)、蔚来汽车等企业担任自动驾驶仿真负责人,国际首创将生成式AI融入仿真。清华大学智能产业研究院助理教授赵昊担任光轮智能首席科学家。赵昊深耕基于生成式AI的仿真、自动驾驶与具身智能算法,曾主导研发全球首个开源的模块化真实感自动驾驶仿真器MARS。光轮团队拥有国内外最多次从0-1合成数据生成和落地经验,汇聚国际顶级生成式AI算法专家、英伟达传感器仿真负责人、国内领先自动驾驶感知负责人、阿里P8、机器人国际大赛
冠军、清华特奖、多次创业者等。员工来自英伟达、华为、Cruise、蔚来、百度、
达摩院等,拥有多项国内外技术专利。公司2023年初成立,已完成种子轮、天使
轮、天使+轮、PreA轮四轮融资,累计融资上亿元。
面对市场上迅猛增长的合成数据需求,光轮智能坚持高质量高效率地交付合成数据,现已交付多家国内外头部主机厂、Tier1、自动驾驶公司数万商业订单,服务量产落地以及端到端算法预研。在自动驾驶端到端方面,光轮作为引领者,开发了首创的端到端数据与仿真的全链路解决方案,积累了大量自动驾驶端到端实战经验。2024年3月,光轮智能与上海人工智能实验室联合推出并开源自动驾驶3DOccupancy合成数据集"LightwheelOcc”,用于CVPR2024自动驾驶挑战赛,本届挑战赛包含了以端到端为代表的众多自动驾驶领域关键技术赛题的比赛。除自动驾驶领域外,光轮智能也开始服务具身智能、多模态大模型等领域,目前国内合成数据领域市场份额稳居第一。

极佳科技

极佳科技是一家专注于世界模型技术和视频生成应用的公司。2023年9月极佳科技推出了全球首个物理世界驱动的自动驾驶世界模型DriveDreamer,在业界引起了广泛的关注。
DriveDreamer是一个生成与理解统一的世界模型架构,基于其高真实度、高效率以及高可扩展性的特点,首先能够实现自动驾驶场景的高效数据生成,用于解决自动驾驶训练的数据短缺,特别是CornerCase难以收集的问题;其次通过与驾驶控制信号的结合,DriveDreamer可以实现高效的数据生成、编辑与交云,从而用于实现端到端自动驾驶的全链路闭环仿真;同时DriveDreamer所具备的场景理解能力,可以扩展实现直接输出端到端的动作指令,成为新一代端到端方案的重要环节。
目前,基于DriveDreamer的产品与方案已经在多个主机厂和自动驾驶科技公司实现定点落地,成为广受认可的自动驾驶世界模型方案。

图片

4、学术研究型机构

上海人工智能实验室

上海人工智能实验室近年来为自动驾驶技术的发展做出了很大的贡献。2022年,上海人工智能实验室开源了BEVFormer架构,时至今日依然是自动驾驶行业内最通用的视觉感知算法架构。2023年6月,上海人工智能实验室、武汉大学及商汤科技联合提出的端到端自动驾驶算法UniAD,获得CVPR2023最佳论文,是近十年来计算机视觉顶级会议中第一篇以中国学术机构作为第一单位的最佳论文。受到BEVFormer和UniAD的启发,自动驾驶行业在BEV感知、端到端自动驾驶方面的研究大大加速。
近半年来,上海人工智能实验室还推出利用大语言模型进行闭环端到端自动驾驶的工作LMDrive、自动驾驶视频生成模型GenAD等,上海人工智能实验室从多个技术维度对自动驾驶技术进行探索,从而多方位提升其智能性。同时,上海人工智能实验室还主导了DriveLM(语言+自动驾驶数据集)、GenAD(驾驶视频数据集)、OpenLane(车道线数据集)、OpenScene(3D占用空间预测数据集)多个自动驾驶开源数据集建设,主办了CVPR2023自动驾驶挑战赛、CVPR2024自动驾驶挑战赛,对自动驾驶研究生态的发展起到重要推动作用。

清华大学MARSLab

清华大学MARSLab由前Waymo科学家赵行成立和主导。2021年初,MARSLab提出了视觉为中心的自动驾驶框架VCAD,发表了一系列BEV和端到端自动驾驶的基石研究论文和工作:首个基于Transformer的视觉BEV检测模型DETR3D、首个视觉BEV3D物体跟踪模型MUTR3D、首个基于Transformer的多传感器前融合3D物体检测模型FUTR3D、首个端到端轨迹预测模型ViP3D、首个3D占用网络的评测基准数据集Occ3D等。MARSLab也是最早发表“无图”自动驾驶方案的团队:2021年初,发布首个在线高精度地图模型HDMapNet;2022年初,发布首个矢量高精度地图模型VectorMapNet;
2023年初,开创性地提出了基于众包的先验神经网络的地图模型,实现了自动驾
驶地图的记忆、更新、感知一体化。该系列工作为行业指明了技术落地方向,其
中合作企业理想汽车将相关技术在其新能源车产品中进行了广泛应用落地:

图片



关注我的公众号auto_driver_ai(Ai fighting), 第一时间获取更新内容。
 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值