自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 LeRobot框架下 Pi0.5 在 LIBERO 环境中的仿真复现与微调实践(Debug篇)

本文总结了在LeRobot框架下训练和评估Pi05模型时遇到的典型问题及解决方案。主要包括:1)模型权重尺寸不对齐问题,需确保词表与tokenizer严格一致;2)HuggingFace网络访问问题,建议使用本地镜像和固定缓存路径;3)无头服务器渲染问题,需配置EGL环境变量;4)多GPU设备映射问题,应显式设置CUDA_VISIBLE_DEVICES;5)评测阶段torch.compile导致的卡顿问题,建议禁用编译功能。这些经验教训有助于提高实验效率和结果可复现性。

2026-05-24 16:53:23 460

原创 LeRobot框架下 Pi0.5 在 LIBERO 环境中的仿真复现与微调实践(含完整 Debug 记录)

本文基于Lerobot框架,使用Openpi系列模型中的pi0.5在Libero仿真环境中进行VLA模型微调训练与评估的全流程实验。重点介绍了LIBERObenchmark的130个任务分类(包括空间关系、物体知识、目标导向等任务套件),并详细说明了实验采用的三种模型:基线模型pi05_libero_base、官方微调模型pi05_libero_finetuned和自主微调模型pi05_libero_my_finetuned。文章阐述了模型部署、数据获取、训练配置和评测流程,特别强调了输入输出接口对齐的重要

2026-05-24 16:43:58 541 1

原创 VLM+LLM针对视频自动解析/答案生成/Web页面开发

本项目开发了一个基于大语言模型(LLM)和视觉语言大模型(VLM)的课程视频自动解析系统。系统通过五步流程:1)分析参考文档风格;2)视频切片;3)逐段视频内容理解;4)课程内容汇总;5)作业题目生成。采用qwen-plus和qwen3-vl-plus模型,实现视频转写、知识点提取、中英双语作业生成等功能。最终输出结构化JSON和可直接使用的Word文档,包含课程摘要、知识点清单、作业题目及参考答案等内容。系统支持Web界面操作,提供上传、查看和下载功能。

2026-03-31 15:32:10 319

原创 Hil-SERL真机复现思路及框架

本项目基于UC伯克利HIL-SERL框架,开发了一套人机协同的具身操作学习系统。系统融合人类示教、模仿学习与强化学习,通过VR/手柄采集示教数据,使用行为克隆初始化策略网络,并引入奖励分类器建模人类偏好。创新性地采用"仿真+真实经验联合回放"机制,允许人类在策略执行时进行实时干预,将纠偏数据回流至训练过程。系统包含机器人控制层、策略推理层、学习管理层和人机交互层,实现了从数据采集、策略训练到真机执行的完整闭环。项目在仿真和真实机械臂上分别验证了物品抓取任务,最终达成100%成功率。

2026-03-13 13:15:12 417

原创 基于Mujoco的HIL-SERL仿真复现工作

基于 LeRobot 与 gym-hil 搭建仿真平台,复现 HIL-SERL 训练流程,通过人类干预强化学习完成机械臂抓取任务并验证算法有效性。

2026-03-08 16:41:50 751 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除