- 博客(125)
- 收藏
- 关注
原创 宇树 G1 部署(十四)——π0.5 部署测试(数据预处理与模型训练)
本文详细记录了基于LeRobot框架的Pi0.5模型训练流程,主要包括四个关键阶段:1. 数据预处理:完成v2.1到v3.0格式转换,验证数据集完整性,进行10步smoke测试;2. 分阶段训练:采用10步验证→300步短训→100k步正式训练的三段式方案;3. 关键问题分析:重点解决task文本质量、quantiles统计缺失、动作维度超限等问题;4. 部署测试:提供真机RTC推理方案,实现动作平滑衔接。文中包含完整的命令示例和参数说明,特别针对G1机器人+多相机场景提供了实用解决方案。通过严格的四道验证
2026-04-20 09:25:49
862
2
原创 lerobot 架构拆解分析(一)——整体框架
本文解析LeRobot v0.5.1模块化架构,重点梳理从设备标定、遥操采集、数据清洗、训练到部署验证的全流程脚本逻辑。突出硬件无关的Robot接口、标准化数据集与Processor胶水层设计,并针对人形机器人遥操映射给出具体说明,为功能适配与二次开发提供清晰指引。
2026-04-14 14:00:00
527
原创 VLA paper 速读《π*0.6: a VLA That Learns From Experience》:RECAP 如何让 VLA 从真实部署里继续变强
摘要 《π*0.6: a VLA That Learns From Experience》提出RECAP方法,通过价值函数和优势条件策略改进预训练视觉语言动作模型(VLA)在真实机器人任务中的表现。核心创新是将传统策略梯度方法转化为"先学习价值函数,再进行优势条件监督提取"的两步流程,使大模型更适合真实部署迭代。在espresso制作、衣物折叠等长时序任务中,该方法显著提升成功率2倍以上,同时降低失败率约50%。关键突破在于利用价值函数估计任务完成度,将动作优势二值化后作为策略条件输入,
2026-04-12 23:00:04
642
原创 宇树 G1 部署(十三)——π0.5 部署测试(遥操数采)
本文介绍了基于LeRobot框架部署VLA模型π0.5的通用方法。主要内容包括: LeRobot已集成主流VLA模型,支持π0.5的完整部署流程,包括训练、推理和机器人接口; 详细记录了Unitree G1人形机器人的环境配置步骤,包括Unitree SDK、CycloneDDS等依赖安装; 提供了五阶段验证流程:从环境检查、仿真测试到真机网络配置和远程控制; 分析了LeRobot中GrootLocomotionController与NVIDIA官方全身遥操作方案的区别; 给出了训练和实时推理(RTC)的具
2026-04-09 08:00:00
655
1
原创 FAST-LIO 部署(三)——G1 部署测试(Lightning-LM版)建图及定位
本文详细记录了Lightning-LM在宇树G1机器人上的部署流程。主要内容包括:1)环境配置(Ubuntu22.04、ROS2Humble及依赖库安装);2)G1部署调试步骤(Livox驱动启动、话题配置、YAML文件修改);3)Lightning-LM的建图与定位功能实现(在线建图、地图保存与验证、基于地图的定位);4)功能指令总结。系统采用LivoxMID-360激光雷达,通过配置不同的YAML文件分别实现建图(含回环检测)和定位功能,并详细说明了参数调整要点和可视化方法。
2025-12-08 16:56:25
2390
原创 FAST-LIO 部署(二)——脚本解析和ROS2升级
本文介绍了FAST-LIO在宇树G1机器人上的两种部署方法:源码部署和docker部署,重点分析了基于Lightning-LM框架的优化方案。Lightning-LM是一个完整的3D激光SLAM系统,采用AA-FasterLIO作为前端,具有模块化架构,支持在线/离线建图与定位。文章详细拆解了其系统架构,包括LIO前端、建图后端、定位模块等核心组件,并讨论了模块升级策略。该方案在CPU资源占用(0.8-1.2核)和实时性(100Hz输出)方面表现优异,适用于动态场景和大规模环境。
2025-12-08 16:55:34
1953
原创 宇树 G1 部署(十一)——遥操作脚本升级 teleop_hand_and_arm_update.py
摘要:本文介绍了一个遥操作脚本的升级版本,主要针对数据采集功能进行了优化。原版存在录制控制不灵活、状态显示不明确等问题。升级内容包括:1)引入pending_stop标志实现"本帧写完即停"功能;2)增加显眼的OSD状态标识(红/橙/绿点)和详细日志;3)使用线程安全的事件机制处理录制切换请求;4)优化录制流程,确保数据完整性。改进后,系统能更直观地显示录制状态,提供精确的帧计数,并在异常退出时自动保存数据。该方案适用于机器人遥操作场景,提升了数据采集的可靠性和用户体验。
2025-12-05 14:27:05
1432
原创 宇树 G1 部署(十三)——本体部署 SLAM 导航
本文记录了在宇树G1机器人上部署导航系统的全流程。主要步骤包括:1)环境安装与配置修改,涉及LivoxSDK2安装、雷达IP设置、地图路径调整;2)解决编译过程中的关键问题,如头文件缺失和ROS版本兼容性问题;3)实际应用部署,包含建图保存、地图编辑和导航启动。特别针对G1机器人特有的环境配置和编译问题提供了详细解决方案,包括ROS软件源修正、依赖包安装等。通过catkin_make-DROS_EDITION=ROS1命令成功完成编译,并提供了地图编辑和导航启动的具体操作指南。整个流程解决了在机器人本体直接
2025-12-05 10:19:44
4044
27
原创 ASAP 部署(四)——ppo.yaml 和 ppo
本文摘要:该研究基于相位运动跟踪策略训练,使用PPO算法在IsaacGym仿真环境中训练29自由度人形机器人。关键配置包括:1)相位观测输入和不对称Actor-Critic设计(actor 380维/critic 557维);2)DeepMimic风格奖励函数;3)参考状态随机初始化(RSI)和终止课程机制;4)4096个并行环境,24步采样地平线。实现细节上,采用三层MLP网络(512-256-128)、自适应KL学习率调度(目标KL=0.01)、0.2裁剪半径、1e-3学习率等超参。日志显示训练速度达7
2025-11-16 13:53:17
1209
原创 ASAP 部署(三)——Phase-based Motion Tracking Policy Training
本文提出了一种基于相位的动作跟踪策略训练方法,使用PPO算法在IsaacGym仿真环境中模仿人形机器人运动。系统采用不对称的Actor-Critic框架:Actor仅依赖本体感知和时间相位变量,而Critic可访问特权信息。关键设计包括:(1)终止课程,逐步收紧动作误差容差;(2)参考状态初始化(RSI),随机化策略跟踪起点;(3)组合奖励函数,包含任务奖励、惩罚项和正则化项。训练时采用4096个并行环境,初始容差设为1.5m并逐步收紧至0.3m。实验结果表明,该方法能有效模仿复杂动作,如C罗"S
2025-11-12 15:41:03
887
原创 FAST-LIO 1/2 paper(一)——论文脉络与要点
FAST-LIO系列算法演进分析 FAST-LIO系列是LiDAR-IMU紧耦合里程计的重要解决方案。FAST-LIO(2021)基于iEKF框架,通过状态维度复杂度优化和运动补偿机制,将计算效率提升至7-25ms/帧。其核心创新包括迭代误差态滤波和新型卡尔曼增益计算公式。FAST-LIO2(2022)在此基础上进一步革新,采用直接点云配准替代特征提取,并引入增量式ikd-Tree地图管理,实现了对任意LiDAR模式的支持和大规模场景的实时建图能力。两代算法均保持严格的时间对齐机制,通过前向传播(IMU)和
2025-11-06 09:57:05
1710
原创 FAST-LIO 部署(一)——综述
摘要:本文介绍了为宇树G1机器人部署轻量化SLAM方案的过程,重点选择了FAST-LIO系列方案。文章详细记录了从FAST-LIO到FAST-LIVO2的升级路径,包括Ubuntu22.04+ROS2的适配过程,以及针对Livox Mid-360和Realsense D435i硬件的配置方法。同时整理了FAST-LIO2的核心技术特性、部署流程和环境配置要求,涵盖了Docker容器构建、源码编译、不同激光雷达型号的配置参数设置等内容。最后还提供了ROS bag示例运行方法和无人机实际部署案例,为轻量化激光雷
2025-11-06 09:55:49
3408
原创 宇树 G1 部署(五)——强化学习运动控制(IsaacLab 版)
本文介绍了使用IsaacLab框架对宇树G1机器人进行训练和部署的完整流程。主要内容包括:1)环境搭建(创建虚拟环境、安装IsaacLab及相关依赖);2)训练流程(使用RSL-RL算法库进行强化学习训练);3)模型回放与导出方法;4)Sim2Sim迁移验证;5)实物部署步骤(网络配置、策略替换和机器人控制)。文章特别强调了从IsaacGym迁移到IsaacLab的注意事项,并提供了G1机器人不同任务的具体训练参数和部署指导。
2025-10-13 09:56:43
6593
3
原创 宇树 G1 部署(四)——强化学习运动控制(IsaacGym 版)
本文介绍了基于宇树开源强化学习框架unitree_rl_gym对G1机器人进行训练和部署的全流程。主要内容包括:1) 环境搭建,推荐使用Ubuntu22.04系统,配置NVIDIA显卡驱动(≥550),创建conda虚拟环境并安装PyTorch2.7.0、IsaacLab5.0.0等必要组件;2) 训练流程,介绍使用RSL-RL框架在IsaacLab中进行G1机器人速度控制任务的训练方法,包括参数配置和结果查看;3) 策略部署,详细说明将训练好的策略模型部署到实物机器人的步骤,包括网络配置、调试模式进入和遥
2025-10-13 09:42:46
4018
原创 机器人强化学习开源项目(一)2025.9.11
具身智能机器人目前主流方案分为模仿学习和强化学习两种思路,当然现在也出现了很多综合方法但是对于非交互式的动作而言,强化学习是最优解,比如各种运动通过在仿真中不断调参,然后在现实中进一步微调,可以实现不错的效果所以这篇笔记主要记录一些做展示效果的项目,并且捋顺研发逻辑。
2025-09-29 15:39:12
986
1
原创 宇树 G1 部署(八)——PC2 驱动安装
本文记录了系统重装后搭建机器人开发环境的详细流程,主要包括:1. 更换G1设备树;2.安装WiFi驱动;3.配置Miniconda和Realsense SDK;4.搭建遥操作环境时遇到的nlopt和CycloneDDS安装问题及解决方案;5.灵巧手环境配置(区分有无触觉版本);6.系统备份方法。重点解决了CycloneDDS源码编译、PyQt5依赖冲突等典型"依赖地狱"问题,并提供了灵巧手控制测试的具体步骤。文中特别强调了不同环境间的兼容性问题,建议通过conda创建独立环境进行隔离。
2025-09-17 10:32:20
3026
原创 ASAP paper(一)——论文脉络与要点
ASAP提出了一种解决仿真与真实机器人动力学失配问题的新方法,通过两阶段框架实现高敏捷动作迁移。第一阶段在仿真中预训练运动策略,第二阶段基于真实轨迹学习动作残差(Δ动作)并微调策略。相比系统辨识(SysID)和域随机化(DR)等方法,Δ动作能更精准地校正仿真物理误差,同时保持策略的敏捷性。实验表明,该方法在Unitree G1机器人上成功实现了踢球、跳跃等高动态任务,在Sim2Sim和Sim2Real迁移中都优于基线方法。其核心优势在于将动作空间残差学习与仿真环境对齐相结合,最终部署时无需保留额外模块。
2025-09-16 19:00:23
1042
原创 ASAP 部署(二)——训练 train_agent.py + 结合 paper 总结运行逻辑
ASAP开源项目摘要:该项目实现了一个基于动作重定向和残差学习的敏捷人形控制框架,主要包括SMPL动作重定向、Delta Action模型训练和策略微调三个阶段。核心流程为:1) 将SMPL动作重定向到机器人;2) 在仿真中训练残差动作模型;3) 结合残差模型微调策略。项目采用模块化设计,通过Hydra配置组合不同训练阶段,支持IsaacGym/IsaacSim等仿真后端。训练入口脚本负责环境与算法实例化,支持PPO和PPO DeltaA两种算法,分别用于动作跟踪和残差学习。项目开源了重定向的动作数据,并提
2025-09-16 18:31:24
1433
3
原创 ASAP 部署(一)——综述
ASAP:实现类人机器人敏捷全身技能的Sim2Real框架 CMU LeCAR Lab团队提出的ASAP框架,通过两阶段训练解决仿真与真实世界的动力学不匹配问题。第一阶段利用重定向人体运动数据预训练运动跟踪策略;第二阶段通过真实世界数据训练增量动作模型,补偿动力学差异,并集成到模拟器中进行策略微调。该框架支持从IsaacGym到IsaacSim、Genesis及真实机器人Unitree G1的迁移,显著提升了动作敏捷性和协调性。项目开源了完整代码、训练流程、ASAPmotion数据集及部署工具,包含环境安装
2025-09-09 11:18:40
3881
3
原创 NVIDIA Isaac GR00T N1.5 部署(七)——微调 scripts 参数分析 gr00t_finetune.py
摘要: gr00t_finetune.py是NVIDIA GR00T N1.5 VLA模型的端到端微调训练脚本,支持单卡/多卡分布式训练。核心功能包括: 数据加载:支持单一或多数据集混合,兼容不同机器人具身类型(如GR1、OXE_DROID等),通过data_config统一数据结构和预处理流程; 模型配置:加载预训练基座模型,可选微调LLM主干、视觉编码器、投影层或扩散动作头,支持LoRA高效参数适配; 训练流程:集成Hugging Face标准参数(如AdamW优化器、余弦学习率调度),支持混合精度(b
2025-08-19 16:04:11
1324
原创 NVIDIA Isaac GR00T N1.5 部署(五)——数据集格式转换
摘要:本文详细介绍了将LeRobot数据格式转换为GR00TLeRobot格式的流程。核心步骤包括:1) 创建meta/modality.json文件,定义state/action片段的语义标签、取值范围等元数据;2) 扩展parquet文件,增加多注释字段支持多任务;3) 完善meta/tasks.jsonl文件存储多语言注释内容。GR00T格式主要强化了数据注释功能,通过标准化的元数据描述使不同机器人/任务的数据能统一处理。关键点在于保持state/action语义分区的一致性,并支持多模态数据的灵活扩
2025-08-19 16:03:40
1327
1
原创 NVIDIA Isaac GR00T N1.5 部署(四)——数据可视化 load_dataset
GR00T LeRobot数据集加载与可视化流程摘要 本文介绍了GR00T LeRobot数据集加载脚本的使用方法和实现逻辑。该脚本提供以下核心功能: 数据加载配置: 通过modality.json定义数据模态(视频、状态、动作、注释) 支持单数据集(LeRobotSingleDataset)和混合数据集(LeRobotMixtureDataset)加载 可配置体态标签(EmbodimentTag)和视频解码后端(decord/torchvision_av) 数据处理流程: 自动解析数据格式并构建Modal
2025-08-19 16:03:10
1370
原创 NVIDIA Isaac GR00T N1.5 部署(二)——数据格式与转换 Robot Data Conversion Guide
GR00TLeRobot数据格式是LeRobot V2.0的扩展升级版本,核心兼容性保持不变。主要升级包括: 新增meta/modality.json文件,用于描述状态和动作数组的切片、旋转格式和归一化方式 支持多注释与多任务扩展 增加更丰富的旋转类型支持 强制要求包含proprioceptor状态 使用建议分为两阶段: 基础阶段可直接使用LeRobot V2.0数据 高级阶段需补全modality.json等扩展文件以支持多模态、多任务等特性 完整数据集结构包含videos、data和meta三个核心目录
2025-08-19 16:02:34
2628
原创 宇树 G1 部署(十)——数据格式转换与 IL 训练
本文介绍了将Unitree机器人采集的数据集转换为LeRobot格式并进行训练部署的完整流程。主要内容包括:1)环境安装,配置LeRobot框架;2)数据采集与转换,详细说明JSON格式数据到LeRobot格式的转换方法,包括自定义机器人配置、修复转换脚本中的bug等;3)模型训练,支持ACT、DiffusionPolicy和pi0等算法;4)真机测试方法;5)常见问题解决方案,如ffmpeg编码器安装、HuggingFace认证等问题。该流程为基于LeRobot框架的机器人模仿学习提供了完整的实现方案,特
2025-08-13 10:13:07
2560
13
原创 扩散模型(二)——DDPM详解
本文详细解析了扩散模型(DDPM)的训练与采样算法及其数学原理。DDPM通过前向加噪过程将图像逐步转化为噪声,再通过反向去噪过程学习从噪声还原图像。核心在于:1)前向过程利用重参数化技巧直接计算任意时间步的噪声分布;2)反向过程通过变分推断和KL散度优化,将问题转化为噪声预测任务;3)采用简化的MSE损失训练网络预测噪声。最终通过从纯噪声逐步去噪生成高质量图像。该方法理论严谨且实现高效,成为当前主流的生成模型范式之一。
2025-08-05 15:00:00
3286
原创 扩散模型(一)——综述
本文系统梳理了扩散模型(Diffusion Models)的理论基础与技术实现。文章首先对比了VAE和GAN等传统生成模型的局限性,指出扩散模型通过模拟噪声扩散与逆扩散过程,在图像、视频生成等领域展现出显著优势。核心内容涵盖:1)理论基础,包括非平衡热力学和马尔可夫链的数学原理;2)工作原理,详细解析正向加噪和逆向去噪的双阶段过程;3)三大主流架构(DDPMs、SGMs、SDEs)的技术特点与对比;4)与传统生成模型的性能比较。文章特别强调了扩散模型在训练稳定性、样本多样性和生成质量方面的突破性进展,并提供
2025-08-03 22:32:31
2107
原创 论文综述:VLA 理论篇笔记(一)——2025.06 π0-roboVLM-π0.5-GR00T N1-GR00T N1.5
本文梳理了当前最具代表性的通用机器人VLA(Vision-Language-Action)模型,包括企业开源的成熟方案π0、高校研究RoboVLM、π0升级版π0.5,以及英伟达的GR00T系列。通过对比模型架构、训练流程、数据策略和评估结果,揭示了VLA领域的关键设计哲学: 架构创新:π0首创流匹配(flow matching)动作生成模块,结合VLM语义理解;π0.5引入分层推理机制;GR00T采用快慢双系统(DiT高频控制+VLM语义推理) 数据策略: 金字塔式数据分层:网络数据(底层)、合成数据(中
2025-08-01 13:49:38
2663
原创 宇树 G1 部署(三)——激光雷达与深度相机
G1机器人传感器配置与数据获取方法 摘要:本文档详细介绍了G1机器人配备的Livox Mid-360激光雷达和RealSense D435i深度相机的数据获取方法。激光雷达位于机器人头部,可通过LivoxViewer2上位机、Livox-SDK2或livox_ros_driver2获取数据,需设置IP为192.168.123.120。深度相机支持通过RealSense Viewer、ROS驱动或SDK获取数据,文档提供了详细的SDK使用示例代码,包括相机参数设置、数据流配置和图像处理。同时说明了USB2.0
2025-07-29 18:23:39
5233
2
原创 宇树 G1 部署(九)——遥操作控制脚本 teleop_hand_and_arm.py 分析与测试部署
基于XR设备的机器人遥操作系统v1.0版本,该系统支持通过手势或手柄控制实际机器人或虚拟仿真。文章详细解析了系统的模块化设计,包括参数配置、图像处理、运动控制和数据记录等核心功能。系统采用共享内存实现多进程通信,支持多相机配置,并通过键盘交互控制程序流程。同时提供了相机适配指南和脚本测试方法,包括图像服务配置、DDS通信设置等。该系统具有高度可扩展性,适用于多种机器人平台和末端执行器的控制需求。
2025-07-29 17:32:37
12445
原创 宇树 G1 部署(二)——遥操作
宇树科技开源了人形机器人XR遥操作系统,支持G1/H1系列机器人和多种灵巧手。该系统提供仿真和实物部署两种方案,包含环境配置、SDK安装、仿真启动等详细教程。关键功能包括手势/手柄控制、数据录制、运动模式切换等。实物部署时需注意安全事项,如保持安全距离、进入调试模式等。代码库结构清晰,包含图像服务、逆运动学计算、数据记录等模块。系统已在Ubuntu 20.04/22.04测试通过,支持Apple Vision Pro等XR设备操作。最新版本优化了DIY功能,简化了操作流程,相关文档和示例代码已在GitHub
2025-07-22 19:50:54
7384
21
原创 宇树 G1 部署(七)——系统重装与镜像还原
1. 强烈不建议把普通 U 盘作为引导设备,nvme 盘是必须的,因此 nvme 移动硬盘盒也是必须的2. 系统镜像还原后还挺大的,如果想做个新系统记得 1T 及以上 nvme 盘3. 我一开始以为 G1 系统重装和 win/linux 一样靠启动盘,直到我买的 256g nvme 盘没装下 8g 的引导系统后,才明白这应该是直接在上面装的系统而不是制作启动盘4. 宇树售后也会犯错,很多问题还是要根据自己判断
2025-07-16 17:25:00
2632
5
原创 宇树 G1 部署(一)——综述
《宇树人形机器人G1开发指南摘要》 本文介绍了宇树科技G1人形机器人的核心开发技术,重点剖析其区别于传统协作机器人的四大算法模块(VLA、多模态、遥操作、强化学习),并详细说明G1的硬件配置与软件开发框架。 硬件方面: G1具备23-43自由度,采用自研120N.m中空轴线电机,集成激光雷达与深度相机 提供双计算单元(Jetson Orin开发单元+专用运控单元)及丰富接口 软件生态: 基于DDS通信架构开发unitree_sdk2,支持底层电机控制(低至关节级)与高层运动服务 开放URDF模型、灵巧手控制
2025-07-09 16:35:24
12180
2
原创 NVIDIA Isaac GR00T N1.5 部署(六)——微调与开环评估
NVIDIA Isaac GR00T N1.5是一个面向通用人形机器人的开放基础模型,兼容LeRobot数据格式。该模型预训练数据集包含GR-1、OpenXE、DexMG等多种来源数据,可直接应用于LeRobot平台。使用步骤包括:1)准备数据集(支持SO-101案例或自定义机器人配置);2)进行模型微调(需约25GB显存);3)开环评估训练效果。用户可通过修改modality.json文件适配不同硬件配置,并利用提供的脚本完成从数据加载到模型评估的全流程。该模型为机器人技能开发提供了灵活高效的基础框架。
2025-06-30 13:36:25
1583
2
原创 NVIDIA Isaac GR00T N1.5 部署(三)——环境安装
本文详细记录了在Ubuntu 22.04系统上搭建深度学习和推理环境的完整流程。主要内容包括:1)CUDA 12.4的安装与配置,包括驱动清理、NVIDIA 550驱动安装、CUDA工具包安装和环境变量设置;2)gr00t环境的创建与依赖安装,强调使用Python 3.10和特定版本的flash-attn;3)TensorRT的pip安装方式及其验证方法。文中特别指出CUDA 12.4的版本要求,并提供了环境验证的具体步骤和常见问题的解决方案。
2025-06-24 09:27:36
1927
原创 NVIDIA Isaac GR00T N1.5 部署(一)——综述
NVIDIA Isaac GR00T N1.5是一款面向人形机器人的开放基础模型,具备多模态输入处理能力(语言+图像)。相比前代N1版本,N1.5在模型架构和数据方面进行了重大升级:采用冻结参数的视觉语言模型(VLM)保持语言理解能力,集成Eagle 2.5基座模型提升视觉-物理对齐性能(IoU提升至40.4),并引入FLARE目标和DreamGen合成数据增强时序预测能力。新版本在语言指令执行准确率(93.3% vs 46.6%)、数据效率和新型物体泛化能力上均有显著提升,支持多种机器人形态的控制器适配。
2025-06-16 17:09:12
4151
原创 Dexcap复现代码运行逻辑全流程(二)——realsense T265测试使用
T265是一款停产的老款RealSense相机,内置Intel V-SLAM算法,主要用于空间定位(输出6DoF位姿),但不提供深度图。与D435/D455等深度相机不同,T265适合运动追踪。文章详细介绍了在Ubuntu系统安装特定版本SDK(v2.50.0)的步骤,包括环境配置、依赖安装和编译过程。同时提供了Python代码示例,展示如何使用pyrealsense2获取T265的鱼眼图像和位姿数据(转换为4×4变换矩阵)。注意需安装匹配版本的Python包pyrealsense2==2.50.0.38
2025-06-11 09:09:58
1394
原创 openpi π₀ 项目部署运行逻辑(四)——机器人主控程序 main.py — aloha_real
本文摘要:该文档介绍了ALOHA机器人主控脚本的实现框架,主要内容包括:1. 系统架构由主控脚本main.py和策略推理服务serve_policy.py通过WebSocket通信组成;2. 主控脚本包含参数配置、服务器连接、运行时环境初始化等功能模块;3. 使用ActionChunkBroker实现批量动作推理以提高效率;4. 详细说明了从创建虚拟环境到实际运行程序的完整使用流程。该框架支持开发者快速部署和测试机器人控制策略,适用于ALOHA等机器人平台的实际应用开发。
2025-05-27 22:16:33
1462
原创 openpi π₀ 项目部署运行逻辑(五)——模型微调
本文记录了使用开源配置进行机器人模型微调的过程。首先通过命令XLA_PYTHON_CLIENT_MEM_FRACTION=0.9 uvrun train.py pi0_aloha_cable_sort --exp-name=5_10 --overwrite启动训练,设置了JAX使用90%的GPU内存。微调包含两个主要步骤:计算训练数据归一化统计量和运行模型微调。在执行过程中遇到了多个错误并给出了解决方案:1)删除了不兼容的local_files_only参数;2)调整了数据集路径配置;3)安装了FFmpeg
2025-05-27 13:41:02
3066
9
原创 openpi π₀ 项目部署运行逻辑(三)——策略推理服务器 serve_policy.py
该脚本实现将Pi0策略模型部署为WebSocket服务,供机器人主控远程调用。核心流程包括:1) 通过参数定义环境类型(ALOHA/DROID等)和模型路径(支持S3或本地);2) 加载预训练策略模型,支持默认或自定义checkpoint;3) 启动WebSocket服务器(默认0.0.0.0:8000),接收观测数据并返回推理动作。
2025-05-26 08:59:42
2244
6
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅