- 博客(5090)
- 收藏
- 关注
转载 自驾正在进入基础设施比拼的阶段......
我们为大家汇总了3DGS和NeRF的相关技术领域,3DGS的算法原理、自动驾驶场景重建与闭环仿真、NeRF与自动驾驶仿真,NeRF与自动驾驶感知,同时我们也邀请到诸位学术界大佬分享3DGS和NeRF的最新工作,这里全都有!这里的活跃度,不是靠“签到”撑起来的,是靠真实的行业讨论撑起来的。针对2025年最火的自动驾驶VLA,我们详细梳理了最新的综述、VLA开源数据集、作为语言解释器的相关算法、模块化VLA、端到端VLA和推理增强VLA,更有诸多关于VLA量产的讨论,在这里有你想知道的一切~
2026-05-06 11:01:08
5
原创 ICRA 2026|清华&博世提出UMPE:自驾地图先验大一统
在这一背景下,清华大学AIR与博世联合提出的UMPE(Unified Map Prior Encoder),并没有沿着“增强某一类地图”的路径继续优化,而是直接改变了问题的出发点。它不再区分地图的类型,而是将所有地图信息视为“可选的先验输入”,统一进入同一个编码体系之中,让模型在训练过程中自行学习不同信息的价值与使用方式。以往方法往往在输入形式与任务目标上有所取舍,有的专注矢量地图建模,有的引入栅格表达,有的尝试利用卫星影像,但很少有方法能够在同一体系内覆盖全部信息来源。值得注意的是,这一过程中引入了。
2026-05-06 11:01:08
55
转载 深扒那些百亿具身公司的掌舵人......
中国科学技术大学自动化系本科,普渡大学电气与计算机工程系博士,南方科技大学教授,曾任美国俄亥俄州立大学电气与计算机工程系(ECE)长聘教授,在此之前于加州大学伯克利分校担任博士后研究员、斯坦福大学担任访问学者。北大前沿计算研究中心助理教授,博士生导师,北大-银河通用具身智能联合实验室和北京智源研究院具身智能研究中心主任,中国具身智能领军人物,国际具身智能顶尖学者。无论是顶尖学霸的降维打击,还是产业老兵的厚积薄发,这群百亿级企业的操盘手,正用最硬核的技术,将科幻小说里的浪漫一行行写进现实。
2026-05-05 17:00:45
40
原创 ICLR 2026 | 博世BridgeDrive:重构数学正确的扩散闭环规划,成功率飙升 7.72%
图中红色的锚点代表的是一个反例,向右行驶的锚点提供的错误先验,会引导扩散模型生成错误的路径规划。并且推理速度满足实车部署要求。直观的理解是,我们通过Doob变换,将数据从一个特定的分布(老虎),“翻译”成指定的另一个分布(狗),并且维持特定的数据结构不变(姿态、表情、几何结构、拓扑关系)。Bench2Drive 是基于 CARLA 的最主流闭环(带有reactive agent)基准,覆盖 220 条复杂路况,专门考核并道、超车、紧急制动、让行、交通标识响应等核心能力,是检验规划可靠性的 “黄金标准”。
2026-05-05 17:00:45
317
原创 重卡不是放大的小车,货运更需要自己的自动驾驶基座模型.....
它不能等风险已经快到眼前再处理,而是要在更长的时序里提前预测,前方道路会怎么变化,旁边车辆会怎么博弈,挂车会扫过哪里,低附着路面下车身会不会进入危险状态。一群自动驾驶从业者,不是在会议室里聊 AI,也不是站在展台边讲参数,直接坐进重卡的货箱里,讨论卡车、货运、Physical AI 和自动驾驶下一阶段的技术路线。WAM 提供对世界变化的理解,强化学习提供在复杂约束下的决策优化,在车展现场圆桌,崔迪潇提到,商用车最核心的锚点是客户的 ROI,所有工程目标、算法架构设计和产品设计,最后都要回到客户价值上。
2026-04-29 17:03:11
529
转载 交大&复旦 Bench2Drive-Speed:速度可控的自动驾驶评测基准
Bench2Drive-Speed 提供了完整的端到端速度可控驾驶研究体系:包括闭环评测框架、可量化的速度与超车指标、2,100 条带指令的数据,以及使用多种策略训练的基线模型。使用 Virtual Target Speed 重标注训练的模型,其速度遵从表现与基于专家内部参数的监督相近,表明速度控制监督可以在无需额外昂贵数据采集的情况下,规模化地应用于训练。带有目标速度指令(target speed)的模型,其闭环轨迹对用户指定速度的贴合程度明显高于未使用速度指令的模型,说明速度可控性是可学习的。
2026-04-29 17:03:11
24
原创 上交AutoLab&中科院提出OneDrive:探索原生VL模型能否统一自驾多种异构任务
进一步地,我们分析了文本监督在训练过程中的作用。实验发现,在联合训练中保留文本loss,可以带来稳定但一致的性能提升,尤其体现在碰撞率等安全指标上。相比之下,依赖完整模型前向的方案,其计算路径与任务解耦程度较低,难以在不牺牲性能的情况下实现类似的加速。具体实现上,我们将自动驾驶中的不同任务统一表示为一组token,并与图像token、文本token拼接成一个共享序列,输入到同一个VLM decoder中进行处理。所以,VLM中真正“可复用”的部分,是其建模token之间关系的能力,而不是具体的特征变换。
2026-04-28 11:00:40
334
转载 轻舟于骞:一家公司要干20年,必须不断革自己的命
实打实的规模落地,既是用户对我们的信任,也是我们构建规模化数据闭环的最强入口,验证了轻舟技术的成熟与可靠。“轻舟的机会恰恰在于,我们可以基于乘用车领域大规模量产的成熟经验,把安全、稳定、可靠的产品能力发挥到物流领域,助力行业提升效率、保障安全。”在于骞看来,进入2026年,无人物流拼的不只是速度,更是服务、性能、综合降本,以及最根本的安全底线与可持续运营能力。新使命背后,有着轻舟更深的思考?因为我们相信,未来AI的智能可能在很多维度超过人类——但人类的好奇心、同理心、对生命的尊重,是技术无法替代的。
2026-04-28 11:00:40
28
原创 NVIDIA吴新宙:世界模型是自动驾驶最本质的一环
再结合前面聊到的车端模型,真实数据采集、数据处理、训练集和测试集构建、仿真验证、部署车队、corner event 回流、数据再生成,这些环节在 Alpamayo 的量产落地图里已经连成了一个闭环。Camera、Radar、Lidar,围绕感知网络、BEV、OCC、在线建图,再到后面的端到端、VLA,行业已经卷了很久。过去一年,自动驾驶行业对VLA、端到端和世界模型的讨论很多,但很多时候大家会把他们拆成几条互相竞争的路线,选了VLA就不能聊世界模型,讲世界模型就一定要脱离端到端。
2026-04-27 17:01:09
608
转载 从表征学习角度看 Being-H0.7、Fast-WAM 与 π0.7
π0.7利用”未来观测“的方式和Being-H0.7、Fast-WAM差别比较大,它使用了一个单独的世界模型BAGEL用来生成subgoal images(比起预测未来的每一帧或者连续的一段视频,subgoal images这种方式更为精巧,动作转换的关键帧对于动作生成或许更有意义),这些subgoal images直接作为输入prompt的一部分,从数据入口侧入手,得到对未来关键帧有感知能力的良好表征。本文通过三篇经典工作,说明了什么是好的表征,应该利用什么样的数据来得到好的表征。
2026-04-26 17:01:06
35
原创 澳门大学WorldDrive:统一视觉与运动表征,让世界模型直接服务自动驾驶规划
为回答这个问题,作者提出了从 Trajectory-aware Driving World Model、到 representation inheritance、再到 Future-aware Rewarder 的完整链路,让世界模型学到的视觉与运动知识不再停留在生成端,而是被真正带入规划端,并在实时推理中发挥作用。对于自动驾驶领域而言,这项工作最值得关注的,也许不是某一个具体数字,而是它传达出的更深一层信号: 世界模型的意义,不只是为了更真实地“生成未来”,更是为了更可靠地“决定未来”。
2026-04-26 17:01:06
593
转载 NVIDIA一篇面向端到端自动驾驶的数据选择工作,很有工程借鉴意义(CVPR‘26)
尤其是在自动驾驶里,一个 clip 的价值并不单一:它可能对车道保持有帮助,对可行驶区域也有帮助,但对 comfort 未必是正收益;Waymo 在去年关于运动预测与规划 scaling law 的研究里,用 50 万小时数据说明一件事:在自动驾驶里,模型性能确实会随着数据、参数和算力继续按规律提升,而且闭环指标也会随之改善。因为自动驾驶的数据价值,从来都不是均匀的。一个弯道 clip,和一个城市密集交通 clip,不只是“长得不一样”,而是它们对 planner 的训练作用本来就不一样。
2026-04-25 15:41:40
22
转载 NVIDIA一篇面向端到端自动驾驶的数据选择工作,很有工程借鉴意义(CVPR‘26)
尤其是在自动驾驶里,一个 clip 的价值并不单一:它可能对车道保持有帮助,对可行驶区域也有帮助,但对 comfort 未必是正收益;Waymo 在去年关于运动预测与规划 scaling law 的研究里,用 50 万小时数据说明一件事:在自动驾驶里,模型性能确实会随着数据、参数和算力继续按规律提升,而且闭环指标也会随之改善。因为自动驾驶的数据价值,从来都不是均匀的。一个弯道 clip,和一个城市密集交通 clip,不只是“长得不一样”,而是它们对 planner 的训练作用本来就不一样。
2026-04-25 15:41:40
27
转载 NVIDIA一篇面向端到端自动驾驶的数据选择工作,很有工程借鉴意义(CVPR‘26)
尤其是在自动驾驶里,一个 clip 的价值并不单一:它可能对车道保持有帮助,对可行驶区域也有帮助,但对 comfort 未必是正收益;Waymo 在去年关于运动预测与规划 scaling law 的研究里,用 50 万小时数据说明一件事:在自动驾驶里,模型性能确实会随着数据、参数和算力继续按规律提升,而且闭环指标也会随之改善。因为自动驾驶的数据价值,从来都不是均匀的。一个弯道 clip,和一个城市密集交通 clip,不只是“长得不一样”,而是它们对 planner 的训练作用本来就不一样。
2026-04-25 15:41:40
28
转载 NVIDIA一篇面向端到端自动驾驶的数据选择工作,很有工程借鉴意义(CVPR‘26)
尤其是在自动驾驶里,一个 clip 的价值并不单一:它可能对车道保持有帮助,对可行驶区域也有帮助,但对 comfort 未必是正收益;Waymo 在去年关于运动预测与规划 scaling law 的研究里,用 50 万小时数据说明一件事:在自动驾驶里,模型性能确实会随着数据、参数和算力继续按规律提升,而且闭环指标也会随之改善。因为自动驾驶的数据价值,从来都不是均匀的。一个弯道 clip,和一个城市密集交通 clip,不只是“长得不一样”,而是它们对 planner 的训练作用本来就不一样。
2026-04-25 15:41:40
33
转载 NVIDIA一篇面向端到端自动驾驶的数据选择工作,很有工程借鉴意义(CVPR‘26)
尤其是在自动驾驶里,一个 clip 的价值并不单一:它可能对车道保持有帮助,对可行驶区域也有帮助,但对 comfort 未必是正收益;Waymo 在去年关于运动预测与规划 scaling law 的研究里,用 50 万小时数据说明一件事:在自动驾驶里,模型性能确实会随着数据、参数和算力继续按规律提升,而且闭环指标也会随之改善。因为自动驾驶的数据价值,从来都不是均匀的。一个弯道 clip,和一个城市密集交通 clip,不只是“长得不一样”,而是它们对 planner 的训练作用本来就不一样。
2026-04-25 15:41:40
22
转载 NVIDIA一篇面向端到端自动驾驶的数据选择工作,很有工程借鉴意义(CVPR‘26)
尤其是在自动驾驶里,一个 clip 的价值并不单一:它可能对车道保持有帮助,对可行驶区域也有帮助,但对 comfort 未必是正收益;Waymo 在去年关于运动预测与规划 scaling law 的研究里,用 50 万小时数据说明一件事:在自动驾驶里,模型性能确实会随着数据、参数和算力继续按规律提升,而且闭环指标也会随之改善。因为自动驾驶的数据价值,从来都不是均匀的。一个弯道 clip,和一个城市密集交通 clip,不只是“长得不一样”,而是它们对 planner 的训练作用本来就不一样。
2026-04-25 15:41:40
20
转载 NVIDIA一篇面向端到端自动驾驶的数据选择工作,很有工程借鉴意义(CVPR‘26)
尤其是在自动驾驶里,一个 clip 的价值并不单一:它可能对车道保持有帮助,对可行驶区域也有帮助,但对 comfort 未必是正收益;Waymo 在去年关于运动预测与规划 scaling law 的研究里,用 50 万小时数据说明一件事:在自动驾驶里,模型性能确实会随着数据、参数和算力继续按规律提升,而且闭环指标也会随之改善。因为自动驾驶的数据价值,从来都不是均匀的。一个弯道 clip,和一个城市密集交通 clip,不只是“长得不一样”,而是它们对 planner 的训练作用本来就不一样。
2026-04-25 15:41:40
20
转载 NVIDIA一篇面向端到端自动驾驶的数据选择工作,很有工程借鉴意义(CVPR‘26)
尤其是在自动驾驶里,一个 clip 的价值并不单一:它可能对车道保持有帮助,对可行驶区域也有帮助,但对 comfort 未必是正收益;Waymo 在去年关于运动预测与规划 scaling law 的研究里,用 50 万小时数据说明一件事:在自动驾驶里,模型性能确实会随着数据、参数和算力继续按规律提升,而且闭环指标也会随之改善。因为自动驾驶的数据价值,从来都不是均匀的。一个弯道 clip,和一个城市密集交通 clip,不只是“长得不一样”,而是它们对 planner 的训练作用本来就不一样。
2026-04-25 15:41:40
8
转载 NVIDIA一篇面向端到端自动驾驶的数据选择工作,很有工程借鉴意义(CVPR‘26)
尤其是在自动驾驶里,一个 clip 的价值并不单一:它可能对车道保持有帮助,对可行驶区域也有帮助,但对 comfort 未必是正收益;Waymo 在去年关于运动预测与规划 scaling law 的研究里,用 50 万小时数据说明一件事:在自动驾驶里,模型性能确实会随着数据、参数和算力继续按规律提升,而且闭环指标也会随之改善。因为自动驾驶的数据价值,从来都不是均匀的。一个弯道 clip,和一个城市密集交通 clip,不只是“长得不一样”,而是它们对 planner 的训练作用本来就不一样。
2026-04-25 15:41:40
5
转载 地平线最新的SparseDrivev2,很有自己做端到端的想法
换句话说,性能并没有提前饱和,先撞墙的反而是算力预算。两年时间里,端到端自动驾驶走得很快:从UniAD、到VADv2,这类方法在显式建模多模态planning的分布,再到 SparseDrive 、GoalFlow 和 DiffusionDriveV2 这些工作,持续在推进“怎么生成更合理的候选轨迹”和“怎么处理多模态不确定性”。目前行业的主流做法,已经很自然地偏向另一边:既然驾驶行为天然是多模态的,既然复杂路口里“唯一正确轨迹”根本不存在,那规划器就该是多模态的形式,自然而然想到了生成类的方法。
2026-04-24 13:33:58
48
转载 华为不想在L4直接开战
靳玉志认为,安全性需要用公开的数据来量化,如果要达到L4级的完全离开驾驶位、不需要方向盘的水平,至少要达到十倍的人驾安全性,这需要数据的积累,此外用户角色转变也需要时间来适应,“即使今天的辅助驾驶L2,很多用户都不敢用,更何况人不在驾驶位上”。过往的经验证明,技术可以一步到位,但用户习惯,法律法规的完善等都需要适应,比如之前很多用户对待辅助驾驶的两个极端态度,要么完全不信任,不敢用,要么过度信任,直接在车上睡大觉,这些都需要时间去不断探索一套可行的方案,:纯无人驾驶,不限定区域,人能开的地方他都能开。
2026-04-22 17:02:15
30
原创 地平线一篇面向端到端的闭环RL训练框架,实车已验证......
RAD-2 想解决的,正是这两个卡脖子的地方。相信大家还记得李志琦的那篇《开环端到端自动驾驶:从入门到放弃》,直接点破开环训练的弊端,做不了量产就是做不了。RAD-2 在论文里也直接指出:纯模仿训练的扩散式规划器,虽然能建模多模态轨迹分布,但仍然会遭遇随机不稳定、没有负反馈、以及开环训练与真实闭环交互不匹配的问题。去年,自动驾驶之心就听说,有团队基于地平线的 RAD 在做落地闭环强化学习训练框架,而且已经基本验证可行。而一旦是模型直接学出来的,开环和闭环训练之间的错位,就会被放大得很明显。
2026-04-21 11:09:08
543
转载 AI Day直播 | Bench2Drive-Speed:速度可控的自动驾驶评测基准
本方法将用户指定的目标速度及超车/跟车指令作为显式控制信号引入驾驶策略模型,并设计了速度跟随得分(Speed-Adherence Score)与超车执行得分(Overtake Score)等定量指标,用于评估策略对用户指令的遵循程度,同时保持与现有自动驾驶评估体系的兼容。实验表明,在合理的重标注策略下,基于常规数据训练的模型性能可与专家演示训练方案相当,此外,研究者们发现模型虽能在不影响常规驾驶表现的前提下实现目标速度跟随,但受限于交互行为本身的复杂性,准确执行超车指令仍具挑战。,为大家解析这篇工作。
2026-04-21 11:09:08
27
转载 李弘扬团队世界引擎:Post-Training开启Physical AGI新纪元
World Engine 首先从海量真实驾驶数据中主动挖掘难例,再以世界模型为工具,对这些难例进行扩散生成后,依托仿真环境进行渲染,放大长尾场景的密度与多样性,让系统在训练中「见过」它在路上可能遇到的一切。模型不再只是模仿人类驾驶员,而是在与难例的反复博弈中,学会真正的安全决策。一年前,DeepSeek R1 横空出世,人们才意识到,真正让模型产生推理能力质变的,不必是更大的预训练规模 —— 后训练,用强化学习、过程奖励、闭环反馈,以极低的代价解锁了原本需要数倍算力才能触达的能力边界。
2026-04-20 17:02:50
37
原创 地平线开始回答自动驾驶世界模型的解法,CompoSIA方案解析......
比如,当你用 3D bounding box 去做结构控制时,box 的位置序列其实隐含了自车的运动信息——你以为自己只改了结构,但自车行为其实已经被结构信号"泄露"了。但场景生成的难点在于细粒度控制:在保持视觉真实感的同时,又能按你的意图去改变"哪辆车长什么样"、"它走什么轨迹"、"自车怎么运动" —— 现有方法大多做不到同时控制好这三件事。训练时,以视频中某一帧为参考,构造"带参考注入的噪声 → 去噪目标帧"的训练对,参考图通过 2D bounding box 做空间对齐,覆盖到目标区域。
2026-04-20 17:02:50
642
转载 国内百亿估值的具身企业分布
链接:https://mx77v4s54co.feishu.cn/wiki/space/7599965572918414554。截止发文时间,中国估值破百亿的企业已有20家,其中,以上具身开源模型的相关信息可在『具身智能之心-开源知识库社区』中查看~,【具身智能之心】团队将国内主流的具身公司估值进行汇总整理,并在。人形机器人、四足、大脑/小脑、仿真、触觉传感器/灵巧手。北京6家、深圳8家、上海和杭州各3家。我们梳理了这20家企业的最新估值并在。『具身智能之心-开源知识库社区』·20家百亿估值企业总榜·
2026-04-18 11:00:35
53
原创 上交一篇VLA结合世界模型的工作VLA-World:利用短程场景生成做反思推理
整体看,VLA-World的做法还是挺聪明的,但可能离上车还有一段距离,目前主要还是在 nuScenes 上做开环评测。和 FSDrive 相比,VLA-World 一个很明确的升级,是显式学习多视角一致性,这对自动驾驶场景理解还是很重要的。随着研究的深入,VLA和世界模型的弊端也逐渐被发现。整体看下来,VLA-World 不完全属于「将世界模型的 latent 表征嵌入到 VLA 的学习中」的这类范式。车辆行驶过程中交互的环境是不确定的,未来场景生成的再逼真,也无法直接决定自车行驶的真实状态。
2026-04-17 11:08:59
351
转载 地平线DiffusionDrive v1和v2的细节对比解读
如论文中提到的,reward的采用最终的轨迹进行计算。将自车的轨迹转换到全局坐标系,然后使用LQR控制器进行轨迹的追踪,得到闭环的轨迹。其中环境信息是开环的,是提前缓存好的。在DD2中,训练时采用的多步采样和DD中DDIM的确定性采样不同,在进行DDIM的确定性采样之后,作者进行了人为加噪。在DD2中RL训练是,采样的是DDPM的采样方式,不过最后的随机噪声就像文中提到的,采取的是横纵乘以随机系数的方式来进行加噪。开源出来的代码,使用的乘法的方式加噪,但是开源出来的代码推导是错的,式5才是正确的计算方式。
2026-04-16 17:06:30
45
转载 看完小鹏刘先明的采访,更能理解VLA 2.0的思路......
自动驾驶和机器人都属于物理 AI,面对的问题本质是一样的,都要与真实物理世界交互,处理非结构化的输入,输出连续而非离散的动作(车子的驾驶动作和机器人的行为动作)。我们去年做了一个特别有意思的事,当时团队里不是所有人都信任这个方向,所以一开始用开源模型再加上 Action(动作)数据训了一套自动驾驶 VLA 模型后,有一天我们几个人偷偷把 Language 拆了,模型但还是用原来的名字,我们第一次上了最大数量的 GPU 来训练模型,GPU 变大,数据量变大变多,拆完训完发现效果挺好的。
2026-04-15 17:02:39
85
转载 端到端量产,到了比拼内力的时刻
由于无法保证模型直出会有100%的准确率,因此会通过一些轨迹的平滑优化算法来使得最终输出的轨迹更加的稳定和可靠,本章会介绍目前一些常用的轨迹平滑算法,既有多模态轨迹打分搜索的算法,也有轨迹平滑的算法。最后的一章重点会对量产的一些经验进行分享,会从数据、模型、场景、规则等多个视角来剖析如何使用合适的工具和手段解决相应的问题,当面临一个实际的可落地的系统时,如何更合理的选用不同的策略和方法,从而能够快速提升一个系统的能力边界。而在端到端时代,感知任务的合并,规控算法的learning化已是绝对的主流。
2026-04-15 17:02:39
22
转载 VLA与WAM的路线之争......
WAM 的崛起,本质上并非 “推翻 VLA”,而是 “补齐 VLA 的短板”—— 以视频预训练为核心,引入物理动态先验,从萌芽阶段的 “视频与动作解耦”,到成熟阶段的 “深度融合”,再到进阶阶段的 “多能力统一”,一步步解决 VLA 的痛点,同时保留了 VLA 的语义理解优势,让机器人既能 “懂是什么”,也能 “懂怎么动”。这两篇文献看下来,让人直观感受是:VLA 解决了 “机器人能听懂、能认出” 的基础问题,但 “物理理解缺失” 这个天花板,它始终没能突破,也让行业开始思考:这条路,或许不是最优解。
2026-04-14 17:07:59
39
原创 NVIDIA一篇面向端到端自动驾驶的数据选择工作,很有工程借鉴意义(CVPR‘26)
尤其是在自动驾驶里,一个 clip 的价值并不单一:它可能对车道保持有帮助,对可行驶区域也有帮助,但对 comfort 未必是正收益;Waymo 在去年关于运动预测与规划 scaling law 的研究里,用 50 万小时数据说明一件事:在自动驾驶里,模型性能确实会随着数据、参数和算力继续按规律提升,而且闭环指标也会随之改善。因为自动驾驶的数据价值,从来都不是均匀的。一个弯道 clip,和一个城市密集交通 clip,不只是“长得不一样”,而是它们对 planner 的训练作用本来就不一样。
2026-04-14 17:07:59
622
原创 华科&小米最新的UniDriveVLA:统一理解、感知和规划
然而,传统端到端模型主要依赖几何与视觉特征的模式匹配,当面对罕见的“长尾场景”(如复杂的交通博弈、异常的行人行为)时,往往因为缺乏常识推理与深度的语义理解能力而显得捉襟见肘。如表1所示,在未使用 PDM-Lite(高阶专家演示数据)的方法中,UniDriveVLA 的驾驶得分(Driving Score)为 78.37,通行效率(Efficiency)为 198.86,路线完成率(Success Rate)为 51.82%。空间感知提供了物理世界的“几何坐标”,语义理解提供了场景背后的“逻辑因果”。
2026-04-14 17:07:59
565
原创 NVIDIA一篇面向端到端自动驾驶的数据选择工作,很有工程借鉴意义(CVPR‘26)
尤其是在自动驾驶里,一个 clip 的价值并不单一:它可能对车道保持有帮助,对可行驶区域也有帮助,但对 comfort 未必是正收益;Waymo 在去年关于运动预测与规划 scaling law 的研究里,用 50 万小时数据说明一件事:在自动驾驶里,模型性能确实会随着数据、参数和算力继续按规律提升,而且闭环指标也会随之改善。因为自动驾驶的数据价值,从来都不是均匀的。一个弯道 clip,和一个城市密集交通 clip,不只是“长得不一样”,而是它们对 planner 的训练作用本来就不一样。
2026-04-14 17:07:59
509
原创 NVIDIA一篇面向端到端自动驾驶的数据选择工作,很有工程借鉴意义(CVPR‘26)
尤其是在自动驾驶里,一个 clip 的价值并不单一:它可能对车道保持有帮助,对可行驶区域也有帮助,但对 comfort 未必是正收益;Waymo 在去年关于运动预测与规划 scaling law 的研究里,用 50 万小时数据说明一件事:在自动驾驶里,模型性能确实会随着数据、参数和算力继续按规律提升,而且闭环指标也会随之改善。因为自动驾驶的数据价值,从来都不是均匀的。一个弯道 clip,和一个城市密集交通 clip,不只是“长得不一样”,而是它们对 planner 的训练作用本来就不一样。
2026-04-14 17:07:59
292
原创 NVIDIA一篇面向端到端自动驾驶的数据选择工作,很有工程借鉴意义(CVPR‘26)
尤其是在自动驾驶里,一个 clip 的价值并不单一:它可能对车道保持有帮助,对可行驶区域也有帮助,但对 comfort 未必是正收益;Waymo 在去年关于运动预测与规划 scaling law 的研究里,用 50 万小时数据说明一件事:在自动驾驶里,模型性能确实会随着数据、参数和算力继续按规律提升,而且闭环指标也会随之改善。因为自动驾驶的数据价值,从来都不是均匀的。一个弯道 clip,和一个城市密集交通 clip,不只是“长得不一样”,而是它们对 planner 的训练作用本来就不一样。
2026-04-14 17:07:59
297
原创 NVIDIA一篇面向端到端自动驾驶的数据选择工作,很有工程借鉴意义(CVPR‘26)
尤其是在自动驾驶里,一个 clip 的价值并不单一:它可能对车道保持有帮助,对可行驶区域也有帮助,但对 comfort 未必是正收益;Waymo 在去年关于运动预测与规划 scaling law 的研究里,用 50 万小时数据说明一件事:在自动驾驶里,模型性能确实会随着数据、参数和算力继续按规律提升,而且闭环指标也会随之改善。因为自动驾驶的数据价值,从来都不是均匀的。一个弯道 clip,和一个城市密集交通 clip,不只是“长得不一样”,而是它们对 planner 的训练作用本来就不一样。
2026-04-14 17:07:59
260
原创 NVIDIA一篇面向端到端自动驾驶的数据选择工作,很有工程借鉴意义(CVPR‘26)
尤其是在自动驾驶里,一个 clip 的价值并不单一:它可能对车道保持有帮助,对可行驶区域也有帮助,但对 comfort 未必是正收益;Waymo 在去年关于运动预测与规划 scaling law 的研究里,用 50 万小时数据说明一件事:在自动驾驶里,模型性能确实会随着数据、参数和算力继续按规律提升,而且闭环指标也会随之改善。因为自动驾驶的数据价值,从来都不是均匀的。一个弯道 clip,和一个城市密集交通 clip,不只是“长得不一样”,而是它们对 planner 的训练作用本来就不一样。
2026-04-14 17:07:59
506
原创 NVIDIA一篇面向端到端自动驾驶的数据选择工作,很有工程借鉴意义(CVPR‘26)
尤其是在自动驾驶里,一个 clip 的价值并不单一:它可能对车道保持有帮助,对可行驶区域也有帮助,但对 comfort 未必是正收益;Waymo 在去年关于运动预测与规划 scaling law 的研究里,用 50 万小时数据说明一件事:在自动驾驶里,模型性能确实会随着数据、参数和算力继续按规律提升,而且闭环指标也会随之改善。因为自动驾驶的数据价值,从来都不是均匀的。一个弯道 clip,和一个城市密集交通 clip,不只是“长得不一样”,而是它们对 planner 的训练作用本来就不一样。
2026-04-14 17:07:59
521
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅