夜幕龙-CSDN博客

原创宇树 G1 部署（十四）——π0.5 部署测试（数据预处理与模型训练）

本文详细记录了基于LeRobot框架的Pi0.5模型训练流程，主要包括四个关键阶段：1. 数据预处理：完成v2.1到v3.0格式转换，验证数据集完整性，进行10步smoke测试；2. 分阶段训练：采用10步验证→300步短训→100k步正式训练的三段式方案；3. 关键问题分析：重点解决task文本质量、quantiles统计缺失、动作维度超限等问题；4. 部署测试：提供真机RTC推理方案，实现动作平滑衔接。文中包含完整的命令示例和参数说明，特别针对G1机器人+多相机场景提供了实用解决方案。通过严格的四道验证

2026-04-20 09:25:49 862 2

原创 lerobot 架构拆解分析（一）——整体框架

本文解析LeRobot v0.5.1模块化架构，重点梳理从设备标定、遥操采集、数据清洗、训练到部署验证的全流程脚本逻辑。突出硬件无关的Robot接口、标准化数据集与Processor胶水层设计，并针对人形机器人遥操映射给出具体说明，为功能适配与二次开发提供清晰指引。

2026-04-14 14:00:00 527

原创 VLA paper 速读《π*0.6: a VLA That Learns From Experience》：RECAP 如何让 VLA 从真实部署里继续变强

摘要《π*0.6: a VLA That Learns From Experience》提出RECAP方法，通过价值函数和优势条件策略改进预训练视觉语言动作模型(VLA)在真实机器人任务中的表现。核心创新是将传统策略梯度方法转化为"先学习价值函数，再进行优势条件监督提取"的两步流程，使大模型更适合真实部署迭代。在espresso制作、衣物折叠等长时序任务中，该方法显著提升成功率2倍以上，同时降低失败率约50%。关键突破在于利用价值函数估计任务完成度，将动作优势二值化后作为策略条件输入，

2026-04-12 23:00:04 642

原创宇树 G1 部署（十三）——π0.5 部署测试（遥操数采）

本文介绍了基于LeRobot框架部署VLA模型π0.5的通用方法。主要内容包括： LeRobot已集成主流VLA模型，支持π0.5的完整部署流程，包括训练、推理和机器人接口；详细记录了Unitree G1人形机器人的环境配置步骤，包括Unitree SDK、CycloneDDS等依赖安装；提供了五阶段验证流程：从环境检查、仿真测试到真机网络配置和远程控制；分析了LeRobot中GrootLocomotionController与NVIDIA官方全身遥操作方案的区别；给出了训练和实时推理(RTC)的具

2026-04-09 08:00:00 655 1

原创 FAST-LIO 部署（三）——G1 部署测试（Lightning-LM版）建图及定位

本文详细记录了Lightning-LM在宇树G1机器人上的部署流程。主要内容包括：1）环境配置（Ubuntu22.04、ROS2Humble及依赖库安装）；2）G1部署调试步骤（Livox驱动启动、话题配置、YAML文件修改）；3）Lightning-LM的建图与定位功能实现（在线建图、地图保存与验证、基于地图的定位）；4）功能指令总结。系统采用LivoxMID-360激光雷达，通过配置不同的YAML文件分别实现建图（含回环检测）和定位功能，并详细说明了参数调整要点和可视化方法。

2025-12-08 16:56:25 2390

原创 FAST-LIO 部署（二）——脚本解析和ROS2升级

本文介绍了FAST-LIO在宇树G1机器人上的两种部署方法：源码部署和docker部署，重点分析了基于Lightning-LM框架的优化方案。Lightning-LM是一个完整的3D激光SLAM系统，采用AA-FasterLIO作为前端，具有模块化架构，支持在线/离线建图与定位。文章详细拆解了其系统架构，包括LIO前端、建图后端、定位模块等核心组件，并讨论了模块升级策略。该方案在CPU资源占用（0.8-1.2核）和实时性（100Hz输出）方面表现优异，适用于动态场景和大规模环境。

2025-12-08 16:55:34 1953

原创宇树 G1 部署（十一）——遥操作脚本升级 teleop_hand_and_arm_update.py

摘要：本文介绍了一个遥操作脚本的升级版本，主要针对数据采集功能进行了优化。原版存在录制控制不灵活、状态显示不明确等问题。升级内容包括：1）引入pending_stop标志实现"本帧写完即停"功能；2）增加显眼的OSD状态标识（红/橙/绿点）和详细日志；3）使用线程安全的事件机制处理录制切换请求；4）优化录制流程，确保数据完整性。改进后，系统能更直观地显示录制状态，提供精确的帧计数，并在异常退出时自动保存数据。该方案适用于机器人遥操作场景，提升了数据采集的可靠性和用户体验。

2025-12-05 14:27:05 1432

原创宇树 G1 部署（十三）——本体部署 SLAM 导航

本文记录了在宇树G1机器人上部署导航系统的全流程。主要步骤包括：1）环境安装与配置修改，涉及LivoxSDK2安装、雷达IP设置、地图路径调整；2）解决编译过程中的关键问题，如头文件缺失和ROS版本兼容性问题；3）实际应用部署，包含建图保存、地图编辑和导航启动。特别针对G1机器人特有的环境配置和编译问题提供了详细解决方案，包括ROS软件源修正、依赖包安装等。通过catkin_make-DROS_EDITION=ROS1命令成功完成编译，并提供了地图编辑和导航启动的具体操作指南。整个流程解决了在机器人本体直接

2025-12-05 10:19:44 4044 27

原创 ASAP 部署（四）——ppo.yaml 和 ppo

本文摘要：该研究基于相位运动跟踪策略训练，使用PPO算法在IsaacGym仿真环境中训练29自由度人形机器人。关键配置包括：1）相位观测输入和不对称Actor-Critic设计（actor 380维/critic 557维）；2）DeepMimic风格奖励函数；3）参考状态随机初始化（RSI）和终止课程机制；4）4096个并行环境，24步采样地平线。实现细节上，采用三层MLP网络（512-256-128）、自适应KL学习率调度（目标KL=0.01）、0.2裁剪半径、1e-3学习率等超参。日志显示训练速度达7

2025-11-16 13:53:17 1209

原创 ASAP 部署（三）——Phase-based Motion Tracking Policy Training

本文提出了一种基于相位的动作跟踪策略训练方法，使用PPO算法在IsaacGym仿真环境中模仿人形机器人运动。系统采用不对称的Actor-Critic框架：Actor仅依赖本体感知和时间相位变量，而Critic可访问特权信息。关键设计包括：(1)终止课程，逐步收紧动作误差容差；(2)参考状态初始化(RSI)，随机化策略跟踪起点；(3)组合奖励函数，包含任务奖励、惩罚项和正则化项。训练时采用4096个并行环境，初始容差设为1.5m并逐步收紧至0.3m。实验结果表明，该方法能有效模仿复杂动作，如C罗"S

2025-11-12 15:41:03 887

原创 FAST-LIO 1/2 paper（一）——论文脉络与要点

FAST-LIO系列算法演进分析 FAST-LIO系列是LiDAR-IMU紧耦合里程计的重要解决方案。FAST-LIO(2021)基于iEKF框架，通过状态维度复杂度优化和运动补偿机制，将计算效率提升至7-25ms/帧。其核心创新包括迭代误差态滤波和新型卡尔曼增益计算公式。FAST-LIO2(2022)在此基础上进一步革新，采用直接点云配准替代特征提取，并引入增量式ikd-Tree地图管理，实现了对任意LiDAR模式的支持和大规模场景的实时建图能力。两代算法均保持严格的时间对齐机制，通过前向传播(IMU)和

2025-11-06 09:57:05 1710

原创 FAST-LIO 部署（一）——综述

摘要：本文介绍了为宇树G1机器人部署轻量化SLAM方案的过程，重点选择了FAST-LIO系列方案。文章详细记录了从FAST-LIO到FAST-LIVO2的升级路径，包括Ubuntu22.04+ROS2的适配过程，以及针对Livox Mid-360和Realsense D435i硬件的配置方法。同时整理了FAST-LIO2的核心技术特性、部署流程和环境配置要求，涵盖了Docker容器构建、源码编译、不同激光雷达型号的配置参数设置等内容。最后还提供了ROS bag示例运行方法和无人机实际部署案例，为轻量化激光雷

2025-11-06 09:55:49 3408

原创宇树 G1 部署（五）——强化学习运动控制（IsaacLab 版）

本文介绍了使用IsaacLab框架对宇树G1机器人进行训练和部署的完整流程。主要内容包括：1）环境搭建（创建虚拟环境、安装IsaacLab及相关依赖）；2）训练流程（使用RSL-RL算法库进行强化学习训练）；3）模型回放与导出方法；4）Sim2Sim迁移验证；5）实物部署步骤（网络配置、策略替换和机器人控制）。文章特别强调了从IsaacGym迁移到IsaacLab的注意事项，并提供了G1机器人不同任务的具体训练参数和部署指导。

2025-10-13 09:56:43 6593 3

原创宇树 G1 部署（四）——强化学习运动控制（IsaacGym 版）

本文介绍了基于宇树开源强化学习框架unitree_rl_gym对G1机器人进行训练和部署的全流程。主要内容包括：1) 环境搭建，推荐使用Ubuntu22.04系统，配置NVIDIA显卡驱动(≥550)，创建conda虚拟环境并安装PyTorch2.7.0、IsaacLab5.0.0等必要组件；2) 训练流程，介绍使用RSL-RL框架在IsaacLab中进行G1机器人速度控制任务的训练方法，包括参数配置和结果查看；3) 策略部署，详细说明将训练好的策略模型部署到实物机器人的步骤，包括网络配置、调试模式进入和遥

2025-10-13 09:42:46 4018

原创机器人强化学习开源项目（一）2025.9.11

具身智能机器人目前主流方案分为模仿学习和强化学习两种思路，当然现在也出现了很多综合方法但是对于非交互式的动作而言，强化学习是最优解，比如各种运动通过在仿真中不断调参，然后在现实中进一步微调，可以实现不错的效果所以这篇笔记主要记录一些做展示效果的项目，并且捋顺研发逻辑。

2025-09-29 15:39:12 986 1

原创宇树 G1 部署（八）——PC2 驱动安装

本文记录了系统重装后搭建机器人开发环境的详细流程，主要包括：1. 更换G1设备树；2.安装WiFi驱动；3.配置Miniconda和Realsense SDK；4.搭建遥操作环境时遇到的nlopt和CycloneDDS安装问题及解决方案；5.灵巧手环境配置（区分有无触觉版本）；6.系统备份方法。重点解决了CycloneDDS源码编译、PyQt5依赖冲突等典型"依赖地狱"问题，并提供了灵巧手控制测试的具体步骤。文中特别强调了不同环境间的兼容性问题，建议通过conda创建独立环境进行隔离。

2025-09-17 10:32:20 3026

原创 ASAP paper（一）——论文脉络与要点

ASAP提出了一种解决仿真与真实机器人动力学失配问题的新方法，通过两阶段框架实现高敏捷动作迁移。第一阶段在仿真中预训练运动策略，第二阶段基于真实轨迹学习动作残差（Δ动作）并微调策略。相比系统辨识（SysID）和域随机化（DR）等方法，Δ动作能更精准地校正仿真物理误差，同时保持策略的敏捷性。实验表明，该方法在Unitree G1机器人上成功实现了踢球、跳跃等高动态任务，在Sim2Sim和Sim2Real迁移中都优于基线方法。其核心优势在于将动作空间残差学习与仿真环境对齐相结合，最终部署时无需保留额外模块。

2025-09-16 19:00:23 1042

原创 ASAP 部署（二）——训练 train_agent.py + 结合 paper 总结运行逻辑

ASAP开源项目摘要：该项目实现了一个基于动作重定向和残差学习的敏捷人形控制框架，主要包括SMPL动作重定向、Delta Action模型训练和策略微调三个阶段。核心流程为：1) 将SMPL动作重定向到机器人；2) 在仿真中训练残差动作模型；3) 结合残差模型微调策略。项目采用模块化设计，通过Hydra配置组合不同训练阶段，支持IsaacGym/IsaacSim等仿真后端。训练入口脚本负责环境与算法实例化，支持PPO和PPO DeltaA两种算法，分别用于动作跟踪和残差学习。项目开源了重定向的动作数据，并提

2025-09-16 18:31:24 1433 3

原创 ASAP 部署（一）——综述

ASAP：实现类人机器人敏捷全身技能的Sim2Real框架 CMU LeCAR Lab团队提出的ASAP框架，通过两阶段训练解决仿真与真实世界的动力学不匹配问题。第一阶段利用重定向人体运动数据预训练运动跟踪策略；第二阶段通过真实世界数据训练增量动作模型，补偿动力学差异，并集成到模拟器中进行策略微调。该框架支持从IsaacGym到IsaacSim、Genesis及真实机器人Unitree G1的迁移，显著提升了动作敏捷性和协调性。项目开源了完整代码、训练流程、ASAPmotion数据集及部署工具，包含环境安装

2025-09-09 11:18:40 3881 3

原创 NVIDIA Isaac GR00T N1.5 部署（七）——微调 scripts 参数分析 gr00t_finetune.py

摘要： gr00t_finetune.py是NVIDIA GR00T N1.5 VLA模型的端到端微调训练脚本，支持单卡/多卡分布式训练。核心功能包括：数据加载：支持单一或多数据集混合，兼容不同机器人具身类型（如GR1、OXE_DROID等），通过data_config统一数据结构和预处理流程；模型配置：加载预训练基座模型，可选微调LLM主干、视觉编码器、投影层或扩散动作头，支持LoRA高效参数适配；训练流程：集成Hugging Face标准参数（如AdamW优化器、余弦学习率调度），支持混合精度（b

2025-08-19 16:04:11 1324

原创 NVIDIA Isaac GR00T N1.5 部署（五）——数据集格式转换

摘要：本文详细介绍了将LeRobot数据格式转换为GR00TLeRobot格式的流程。核心步骤包括：1) 创建meta/modality.json文件，定义state/action片段的语义标签、取值范围等元数据；2) 扩展parquet文件，增加多注释字段支持多任务；3) 完善meta/tasks.jsonl文件存储多语言注释内容。GR00T格式主要强化了数据注释功能，通过标准化的元数据描述使不同机器人/任务的数据能统一处理。关键点在于保持state/action语义分区的一致性，并支持多模态数据的灵活扩

2025-08-19 16:03:40 1327 1

原创 NVIDIA Isaac GR00T N1.5 部署（四）——数据可视化 load_dataset

GR00T LeRobot数据集加载与可视化流程摘要本文介绍了GR00T LeRobot数据集加载脚本的使用方法和实现逻辑。该脚本提供以下核心功能：数据加载配置：通过modality.json定义数据模态（视频、状态、动作、注释）支持单数据集(LeRobotSingleDataset)和混合数据集(LeRobotMixtureDataset)加载可配置体态标签(EmbodimentTag)和视频解码后端(decord/torchvision_av) 数据处理流程：自动解析数据格式并构建Modal

2025-08-19 16:03:10 1370

原创 NVIDIA Isaac GR00T N1.5 部署（二）——数据格式与转换 Robot Data Conversion Guide

GR00TLeRobot数据格式是LeRobot V2.0的扩展升级版本，核心兼容性保持不变。主要升级包括：新增meta/modality.json文件，用于描述状态和动作数组的切片、旋转格式和归一化方式支持多注释与多任务扩展增加更丰富的旋转类型支持强制要求包含proprioceptor状态使用建议分为两阶段：基础阶段可直接使用LeRobot V2.0数据高级阶段需补全modality.json等扩展文件以支持多模态、多任务等特性完整数据集结构包含videos、data和meta三个核心目录

2025-08-19 16:02:34 2628

原创宇树 G1 部署（十）——数据格式转换与 IL 训练

本文介绍了将Unitree机器人采集的数据集转换为LeRobot格式并进行训练部署的完整流程。主要内容包括：1)环境安装，配置LeRobot框架；2)数据采集与转换，详细说明JSON格式数据到LeRobot格式的转换方法，包括自定义机器人配置、修复转换脚本中的bug等；3)模型训练，支持ACT、DiffusionPolicy和pi0等算法；4)真机测试方法；5)常见问题解决方案，如ffmpeg编码器安装、HuggingFace认证等问题。该流程为基于LeRobot框架的机器人模仿学习提供了完整的实现方案，特

2025-08-13 10:13:07 2560 13

原创扩散模型（二）——DDPM详解

本文详细解析了扩散模型（DDPM）的训练与采样算法及其数学原理。DDPM通过前向加噪过程将图像逐步转化为噪声，再通过反向去噪过程学习从噪声还原图像。核心在于：1）前向过程利用重参数化技巧直接计算任意时间步的噪声分布；2）反向过程通过变分推断和KL散度优化，将问题转化为噪声预测任务；3）采用简化的MSE损失训练网络预测噪声。最终通过从纯噪声逐步去噪生成高质量图像。该方法理论严谨且实现高效，成为当前主流的生成模型范式之一。

2025-08-05 15:00:00 3286

原创扩散模型（一）——综述

本文系统梳理了扩散模型（Diffusion Models）的理论基础与技术实现。文章首先对比了VAE和GAN等传统生成模型的局限性，指出扩散模型通过模拟噪声扩散与逆扩散过程，在图像、视频生成等领域展现出显著优势。核心内容涵盖：1）理论基础，包括非平衡热力学和马尔可夫链的数学原理；2）工作原理，详细解析正向加噪和逆向去噪的双阶段过程；3）三大主流架构（DDPMs、SGMs、SDEs）的技术特点与对比；4）与传统生成模型的性能比较。文章特别强调了扩散模型在训练稳定性、样本多样性和生成质量方面的突破性进展，并提供

2025-08-03 22:32:31 2107

原创论文综述：VLA 理论篇笔记（一）——2025.06 π0-roboVLM-π0.5-GR00T N1-GR00T N1.5

本文梳理了当前最具代表性的通用机器人VLA（Vision-Language-Action）模型，包括企业开源的成熟方案π0、高校研究RoboVLM、π0升级版π0.5，以及英伟达的GR00T系列。通过对比模型架构、训练流程、数据策略和评估结果，揭示了VLA领域的关键设计哲学：架构创新：π0首创流匹配（flow matching）动作生成模块，结合VLM语义理解；π0.5引入分层推理机制；GR00T采用快慢双系统（DiT高频控制+VLM语义推理）数据策略：金字塔式数据分层：网络数据（底层）、合成数据（中

2025-08-01 13:49:38 2663

原创宇树 G1 部署（三）——激光雷达与深度相机

G1机器人传感器配置与数据获取方法摘要：本文档详细介绍了G1机器人配备的Livox Mid-360激光雷达和RealSense D435i深度相机的数据获取方法。激光雷达位于机器人头部，可通过LivoxViewer2上位机、Livox-SDK2或livox_ros_driver2获取数据，需设置IP为192.168.123.120。深度相机支持通过RealSense Viewer、ROS驱动或SDK获取数据，文档提供了详细的SDK使用示例代码，包括相机参数设置、数据流配置和图像处理。同时说明了USB2.0

2025-07-29 18:23:39 5233 2

原创宇树 G1 部署（九）——遥操作控制脚本 teleop_hand_and_arm.py 分析与测试部署

基于XR设备的机器人遥操作系统v1.0版本，该系统支持通过手势或手柄控制实际机器人或虚拟仿真。文章详细解析了系统的模块化设计，包括参数配置、图像处理、运动控制和数据记录等核心功能。系统采用共享内存实现多进程通信，支持多相机配置，并通过键盘交互控制程序流程。同时提供了相机适配指南和脚本测试方法，包括图像服务配置、DDS通信设置等。该系统具有高度可扩展性，适用于多种机器人平台和末端执行器的控制需求。

2025-07-29 17:32:37 12445

原创宇树 G1 部署（二）——遥操作

宇树科技开源了人形机器人XR遥操作系统，支持G1/H1系列机器人和多种灵巧手。该系统提供仿真和实物部署两种方案，包含环境配置、SDK安装、仿真启动等详细教程。关键功能包括手势/手柄控制、数据录制、运动模式切换等。实物部署时需注意安全事项，如保持安全距离、进入调试模式等。代码库结构清晰，包含图像服务、逆运动学计算、数据记录等模块。系统已在Ubuntu 20.04/22.04测试通过，支持Apple Vision Pro等XR设备操作。最新版本优化了DIY功能，简化了操作流程，相关文档和示例代码已在GitHub

2025-07-22 19:50:54 7384 21

原创宇树 G1 部署（七）——系统重装与镜像还原

1. 强烈不建议把普通 U 盘作为引导设备，nvme 盘是必须的，因此 nvme 移动硬盘盒也是必须的2. 系统镜像还原后还挺大的，如果想做个新系统记得 1T 及以上 nvme 盘3. 我一开始以为 G1 系统重装和 win/linux 一样靠启动盘，直到我买的 256g nvme 盘没装下 8g 的引导系统后，才明白这应该是直接在上面装的系统而不是制作启动盘4. 宇树售后也会犯错，很多问题还是要根据自己判断

2025-07-16 17:25:00 2632 5

原创宇树 G1 部署（一）——综述

《宇树人形机器人G1开发指南摘要》本文介绍了宇树科技G1人形机器人的核心开发技术，重点剖析其区别于传统协作机器人的四大算法模块（VLA、多模态、遥操作、强化学习），并详细说明G1的硬件配置与软件开发框架。硬件方面： G1具备23-43自由度，采用自研120N.m中空轴线电机，集成激光雷达与深度相机提供双计算单元（Jetson Orin开发单元+专用运控单元）及丰富接口软件生态：基于DDS通信架构开发unitree_sdk2，支持底层电机控制（低至关节级）与高层运动服务开放URDF模型、灵巧手控制

2025-07-09 16:35:24 12180 2

原创 NVIDIA Isaac GR00T N1.5 部署（六）——微调与开环评估

NVIDIA Isaac GR00T N1.5是一个面向通用人形机器人的开放基础模型，兼容LeRobot数据格式。该模型预训练数据集包含GR-1、OpenXE、DexMG等多种来源数据，可直接应用于LeRobot平台。使用步骤包括：1）准备数据集（支持SO-101案例或自定义机器人配置）；2）进行模型微调（需约25GB显存）；3）开环评估训练效果。用户可通过修改modality.json文件适配不同硬件配置，并利用提供的脚本完成从数据加载到模型评估的全流程。该模型为机器人技能开发提供了灵活高效的基础框架。

2025-06-30 13:36:25 1583 2

原创 NVIDIA Isaac GR00T N1.5 部署（三）——环境安装

本文详细记录了在Ubuntu 22.04系统上搭建深度学习和推理环境的完整流程。主要内容包括：1）CUDA 12.4的安装与配置，包括驱动清理、NVIDIA 550驱动安装、CUDA工具包安装和环境变量设置；2）gr00t环境的创建与依赖安装，强调使用Python 3.10和特定版本的flash-attn；3）TensorRT的pip安装方式及其验证方法。文中特别指出CUDA 12.4的版本要求，并提供了环境验证的具体步骤和常见问题的解决方案。

2025-06-24 09:27:36 1927

原创 NVIDIA Isaac GR00T N1.5 部署（一）——综述

NVIDIA Isaac GR00T N1.5是一款面向人形机器人的开放基础模型，具备多模态输入处理能力（语言+图像）。相比前代N1版本，N1.5在模型架构和数据方面进行了重大升级：采用冻结参数的视觉语言模型（VLM）保持语言理解能力，集成Eagle 2.5基座模型提升视觉-物理对齐性能（IoU提升至40.4），并引入FLARE目标和DreamGen合成数据增强时序预测能力。新版本在语言指令执行准确率（93.3% vs 46.6%）、数据效率和新型物体泛化能力上均有显著提升，支持多种机器人形态的控制器适配。

2025-06-16 17:09:12 4151

原创 Dexcap复现代码运行逻辑全流程（二）——realsense T265测试使用

T265是一款停产的老款RealSense相机，内置Intel V-SLAM算法，主要用于空间定位（输出6DoF位姿），但不提供深度图。与D435/D455等深度相机不同，T265适合运动追踪。文章详细介绍了在Ubuntu系统安装特定版本SDK（v2.50.0）的步骤，包括环境配置、依赖安装和编译过程。同时提供了Python代码示例，展示如何使用pyrealsense2获取T265的鱼眼图像和位姿数据（转换为4×4变换矩阵）。注意需安装匹配版本的Python包pyrealsense2==2.50.0.38

2025-06-11 09:09:58 1394

原创 openpi π₀ 项目部署运行逻辑（四）——机器人主控程序 main.py — aloha_real

本文摘要：该文档介绍了ALOHA机器人主控脚本的实现框架，主要内容包括：1. 系统架构由主控脚本main.py和策略推理服务serve_policy.py通过WebSocket通信组成；2. 主控脚本包含参数配置、服务器连接、运行时环境初始化等功能模块；3. 使用ActionChunkBroker实现批量动作推理以提高效率；4. 详细说明了从创建虚拟环境到实际运行程序的完整使用流程。该框架支持开发者快速部署和测试机器人控制策略，适用于ALOHA等机器人平台的实际应用开发。

2025-05-27 22:16:33 1462

原创 openpi π₀ 项目部署运行逻辑（五）——模型微调

本文记录了使用开源配置进行机器人模型微调的过程。首先通过命令XLA_PYTHON_CLIENT_MEM_FRACTION=0.9 uvrun train.py pi0_aloha_cable_sort --exp-name=5_10 --overwrite启动训练，设置了JAX使用90%的GPU内存。微调包含两个主要步骤：计算训练数据归一化统计量和运行模型微调。在执行过程中遇到了多个错误并给出了解决方案：1）删除了不兼容的local_files_only参数；2）调整了数据集路径配置；3）安装了FFmpeg

2025-05-27 13:41:02 3066 9

原创 openpi π₀ 项目部署运行逻辑（三）——策略推理服务器 serve_policy.py

该脚本实现将Pi0策略模型部署为WebSocket服务，供机器人主控远程调用。核心流程包括：1) 通过参数定义环境类型（ALOHA/DROID等）和模型路径（支持S3或本地）；2) 加载预训练策略模型，支持默认或自定义checkpoint；3) 启动WebSocket服务器（默认0.0.0.0:8000），接收观测数据并返回推理动作。

2025-05-26 08:59:42 2244 6

原创 openpi π₀ 项目部署运行逻辑（二）——环境配置与测试

openpi 开源了几个训练好的 π₀ 权重，使用源码简单做一下测试

2025-05-26 08:55:25 6309 7

空空如也

空空如也