具身机器人及VLA算法
文章平均质量分 88
具身机器人及VLA算法
LeeZhao@
现任上市职教集团AI讲师,曾任多家头部互联网大厂资深算法专家。深耕大模型、计算机视觉与多模态技术领域,专注模型推理加速、部署优化及工业级落地解决方案。
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
【具身智能】RK3576 + ROS2 Humble 实战:SLAM 建图与 Nav2 导航从零到部署
本文档详细介绍了在RK3576开发板上基于ROS2 Humble实现SLAM建图与Nav2导航的全流程。内容涵盖环境配置、URDF建模、SLAM Toolbox建图、Nav2导航系统部署等关键技术,并针对工业级应用场景提供性能调优与问题排查方案。通过Gazebo仿真与TurtleBot3模型验证系统功能,帮助开发者从零构建完整的自主移动机器人系统。文档特别强调了SLAM Toolbox的图优化框架和Nav2的行为树机制等核心技术优势,为工程化部署提供实用指导。原创 2026-03-24 21:15:58 · 548 阅读 · 0 评论 -
【具身智能】RoboChallenge新王登基-Spirit v1.5
RoboChallenge作为2025年新推出的具身智能标准化评测平台,聚焦真实机器人执行能力,通过统一硬件和任务集(Table30)评估模型的跨场景操作稳定性。Spirit v1.5在该评测中凭借整体任务完成度和长序列执行稳定性获得综合第一,其技术核心在于: 统一建模:采用Vision-Language-Action(VLA)架构,整合感知、决策与动作生成,减少模块间误差累积; 真实数据训练:放弃传统“干净”演示数据,引入含失败调整的多样化轨迹,提升泛化与容错能力;原创 2026-01-14 11:41:18 · 854 阅读 · 1 评论 -
【具身智能】具身机器人VLA算法入门及实战(四):具身智能VLA技术行业进展
具身智能VLA技术行业进展摘要 本文综述了具身智能VLA(视觉-语言-动作)技术在自动驾驶领域的最新进展。理想汽车发布了基于VLA的技术报告;小鹏汽车宣布研发VLA基座模型和世界模型,并拥有10EFLOPS算力;元戎启行计划年内推出基于英伟达Thor芯片的VLA量产车型;小米汽车与华中科技大学提出ORION框架,解决端到端自动驾驶的因果推理瓶颈。文章还列举了包括RT-2、OpenVLA等在内的关键VLA研究论文,展示了该技术在机器人控制、自动驾驶等领域的广泛应用和发展趋势。原创 2025-10-16 00:53:48 · 1475 阅读 · 0 评论 -
【具身智能】具身机器人VLA算法入门及实战(三):VLA经典模型架构
VLA模型技术进展综述 当前视觉-语言-动作(VLA)模型在机器人控制和自动驾驶领域取得重大突破。谷歌DeepMind的RT-2通过动作文本化编码和联合微调策略,实现跨模态统一表示。OpenVLA作为首个开源VLA模型,显著降低技术门槛。OpenDriveVLA针对自动驾驶设计层次化视觉-语言对齐方法,提升语义理解能力。Figure.AI的Helix模型以200Hz高频控制刷新性能记录,采用快慢双系统架构。研究还提出双过程VLA模型优化计算效率,以及CoVLA数据集推动自动驾驶长尾场景突破。理想汽车的Dri原创 2025-10-16 00:46:23 · 1771 阅读 · 0 评论 -
【具身智能】具身机器人VLA算法入门及实战(二):VLA技术概述
VLA(视觉-语言-动作模型)是一种融合视觉感知、语言理解和动作执行的多模态大模型,将动作作为直接输出,实现与物理世界的智能交互。相比VLM(视觉-语言模型),VLA在自动驾驶、机器人等领域具有更高上限,但面临数据不足、多模态对齐困难、模型复杂度高等挑战。训练数据量级不足且多样性有限,图像、语言和动作的异质模态难以同步对齐,三模态联合建模导致参数爆炸和推理速度下降。尽管Google RT-2等进展展示了潜力,VLA技术仍处于发展初期,需解决数据采集、模态对齐和模型优化等关键问题。原创 2025-10-15 09:13:58 · 1256 阅读 · 0 评论 -
【具身智能】具身机器人VLA算法入门及实战(一):具身智能系统及VLA
本文介绍了具身智能系统及VLA算法的入门知识。主要内容包括:1)常见具身智能系统架构;2)数据获取方式(Isaac Sim、Mujoco等平台)和数据增强方法;3)感知系统设计;4)具身智能学习方式;5)工业机器人应用需求;6)VLA架构及开源项目(如智元机器人、Openloong、UMI等);7)机器人操作实际案例。重点解析了VLA(Vision-Language-Action)算法框架及其在机器人控制中的应用,展示了多个开源项目的技术特点,为具身智能研究和实践提供了系统性参考。原创 2025-10-15 09:07:20 · 1496 阅读 · 0 评论
分享