自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

Zlong1231的博客

原创 LeRobot框架下 Pi0.5 在 LIBERO 环境中的仿真复现与微调实践（Debug篇）

本文总结了在LeRobot框架下训练和评估Pi05模型时遇到的典型问题及解决方案。主要包括：1）模型权重尺寸不对齐问题，需确保词表与tokenizer严格一致；2）HuggingFace网络访问问题，建议使用本地镜像和固定缓存路径；3）无头服务器渲染问题，需配置EGL环境变量；4）多GPU设备映射问题，应显式设置CUDA_VISIBLE_DEVICES；5）评测阶段torch.compile导致的卡顿问题，建议禁用编译功能。这些经验教训有助于提高实验效率和结果可复现性。

2026-05-24 16:53:23 460

原创 LeRobot框架下 Pi0.5 在 LIBERO 环境中的仿真复现与微调实践（含完整 Debug 记录）

本文基于Lerobot框架，使用Openpi系列模型中的pi0.5在Libero仿真环境中进行VLA模型微调训练与评估的全流程实验。重点介绍了LIBERObenchmark的130个任务分类（包括空间关系、物体知识、目标导向等任务套件），并详细说明了实验采用的三种模型：基线模型pi05_libero_base、官方微调模型pi05_libero_finetuned和自主微调模型pi05_libero_my_finetuned。文章阐述了模型部署、数据获取、训练配置和评测流程，特别强调了输入输出接口对齐的重要

2026-05-24 16:43:58 541 1

原创 VLM+LLM针对视频自动解析/答案生成/Web页面开发

本项目开发了一个基于大语言模型(LLM)和视觉语言大模型(VLM)的课程视频自动解析系统。系统通过五步流程：1)分析参考文档风格；2)视频切片；3)逐段视频内容理解；4)课程内容汇总；5)作业题目生成。采用qwen-plus和qwen3-vl-plus模型，实现视频转写、知识点提取、中英双语作业生成等功能。最终输出结构化JSON和可直接使用的Word文档，包含课程摘要、知识点清单、作业题目及参考答案等内容。系统支持Web界面操作，提供上传、查看和下载功能。

2026-03-31 15:32:10 319

原创 Hil-SERL真机复现思路及框架

本项目基于UC伯克利HIL-SERL框架，开发了一套人机协同的具身操作学习系统。系统融合人类示教、模仿学习与强化学习，通过VR/手柄采集示教数据，使用行为克隆初始化策略网络，并引入奖励分类器建模人类偏好。创新性地采用"仿真+真实经验联合回放"机制，允许人类在策略执行时进行实时干预，将纠偏数据回流至训练过程。系统包含机器人控制层、策略推理层、学习管理层和人机交互层，实现了从数据采集、策略训练到真机执行的完整闭环。项目在仿真和真实机械臂上分别验证了物品抓取任务，最终达成100%成功率。

2026-03-13 13:15:12 417

原创基于Mujoco的HIL-SERL仿真复现工作

基于 LeRobot 与 gym-hil 搭建仿真平台，复现 HIL-SERL 训练流程，通过人类干预强化学习完成机械臂抓取任务并验证算法有效性。

2026-03-08 16:41:50 751 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示

确定要删除当前文章？

取消删除