自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

原创 VLM+LLM针对视频自动解析/答案生成/Web页面开发

本项目开发了一个基于大语言模型(LLM)和视觉语言大模型(VLM)的课程视频自动解析系统。系统通过五步流程:1)分析参考文档风格;2)视频切片;3)逐段视频内容理解;4)课程内容汇总;5)作业题目生成。采用qwen-plus和qwen3-vl-plus模型,实现视频转写、知识点提取、中英双语作业生成等功能。最终输出结构化JSON和可直接使用的Word文档,包含课程摘要、知识点清单、作业题目及参考答案等内容。系统支持Web界面操作,提供上传、查看和下载功能。

2026-03-31 15:32:10 272

原创 Hil-SERL真机复现思路及框架

本项目基于UC伯克利HIL-SERL框架,开发了一套人机协同的具身操作学习系统。系统融合人类示教、模仿学习与强化学习,通过VR/手柄采集示教数据,使用行为克隆初始化策略网络,并引入奖励分类器建模人类偏好。创新性地采用"仿真+真实经验联合回放"机制,允许人类在策略执行时进行实时干预,将纠偏数据回流至训练过程。系统包含机器人控制层、策略推理层、学习管理层和人机交互层,实现了从数据采集、策略训练到真机执行的完整闭环。项目在仿真和真实机械臂上分别验证了物品抓取任务,最终达成100%成功率。

2026-03-13 13:15:12 375

原创 基于Mujoco的HIL-SERL仿真复现工作

基于 LeRobot 与 gym-hil 搭建仿真平台,复现 HIL-SERL 训练流程,通过人类干预强化学习完成机械臂抓取任务并验证算法有效性。

2026-03-08 16:41:50 573

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除