具身智能
文章平均质量分 96
Sherlock Ma
研究生在读,致力于分享编程技术。主要研究人工智能相关,包括大模型、AIGC等。偶尔也会更新Java内容
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
GT-RL:首个让机器人学会系鞋带的VLA
字节跳动Seed团队提出GR-RL框架,解决了机器人长程精密操作难题。该框架通过强化学习增强的多阶段训练流程,将通用视觉-语言-动作模型转化为专家型政策,成功实现机器人自主系鞋带任务,成功率高达83.3%。GR-RL采用混合Transformer架构,包含策略网络和评论家网络,通过数据过滤、形态对称性增强和在线强化学习优化,有效解决了人类演示数据噪声、训练-部署不匹配等问题。实验表明,GR-RL在拾鞋带、穿鞋眼等精密操作环节表现优异,为机器人真实场景应用提供了可靠解决方案。原创 2025-12-04 11:36:54 · 1280 阅读 · 0 评论 -
字节跳动GR-3:可泛化、支持长序列复杂操作任务的机器人操作大模型(技术报告解读)
GR-3是一个大规模视觉-语言-动作(VLA)模型,具备强大的泛化能力,能够处理新物体、新环境和抽象指令。通过协同训练大规模视觉-语言数据和机器人轨迹数据,GR-3实现了对复杂语义的理解和动作预测。其高效的小样本学习能力仅需少量人类轨迹即可快速适配新任务。实验表明,GR-3在可泛化抓取放置、长跨度桌面整理和灵巧布料操作等任务中表现优异,显著超越基线方法。结合专为灵巧操作设计的双臂移动机器人ByteMini,GR-3展现了高可靠性和鲁棒性,为通用机器人技术的发展提供了重要基础。原创 2025-07-30 21:38:21 · 1908 阅读 · 0 评论 -
RoboFactory:多具身智能体协同框架(论文代码详解)
这篇文章提出了一种创新的框架,旨在通过引入组合约束来解决多智能体系统中的协作问题,并自动生成安全、高效的训练数据。文章的核心贡献在于设计了一种能够有效管理多智能体协作的框架——RoboFactory,该框架通过逻辑、空间和时间三个维度的约束,确保智能体在执行任务时的行为既安全又高效。RoboFactory框架包含两个核心模块:RoboBrain和RoboChecker。RoboBrain负责根据全局任务描述、先前的子目标和约束违规反馈,生成每个智能体的下一个子目标和文本形式的组合约束。原创 2025-05-28 21:06:40 · 2148 阅读 · 0 评论
分享