- 博客(3)
- 收藏
- 关注
原创 VLM+LLM针对视频自动解析/答案生成/Web页面开发
本项目开发了一个基于大语言模型(LLM)和视觉语言大模型(VLM)的课程视频自动解析系统。系统通过五步流程:1)分析参考文档风格;2)视频切片;3)逐段视频内容理解;4)课程内容汇总;5)作业题目生成。采用qwen-plus和qwen3-vl-plus模型,实现视频转写、知识点提取、中英双语作业生成等功能。最终输出结构化JSON和可直接使用的Word文档,包含课程摘要、知识点清单、作业题目及参考答案等内容。系统支持Web界面操作,提供上传、查看和下载功能。
2026-03-31 15:32:10
272
原创 Hil-SERL真机复现思路及框架
本项目基于UC伯克利HIL-SERL框架,开发了一套人机协同的具身操作学习系统。系统融合人类示教、模仿学习与强化学习,通过VR/手柄采集示教数据,使用行为克隆初始化策略网络,并引入奖励分类器建模人类偏好。创新性地采用"仿真+真实经验联合回放"机制,允许人类在策略执行时进行实时干预,将纠偏数据回流至训练过程。系统包含机器人控制层、策略推理层、学习管理层和人机交互层,实现了从数据采集、策略训练到真机执行的完整闭环。项目在仿真和真实机械臂上分别验证了物品抓取任务,最终达成100%成功率。
2026-03-13 13:15:12
375
原创 基于Mujoco的HIL-SERL仿真复现工作
基于 LeRobot 与 gym-hil 搭建仿真平台,复现 HIL-SERL 训练流程,通过人类干预强化学习完成机械臂抓取任务并验证算法有效性。
2026-03-08 16:41:50
573
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅