真VLA第二弹,Psi R1 实现大脑通用泛化性!
原创 PsiBot 灵初智能 2025年04月29日 13:59 中国香港
前情提要
Psi R1 发布了第一个结合强化学习的VLA,在麻将场景下,成功展示了开放环境中长线复杂任务的灵巧操作能力。
毫米级精度灵巧操作:灵巧手攻克视觉-语言-动作模态对齐,实现精确翻牌、抓牌、理牌,展现类人类的灵巧操作级别。
人机交互与认知决策:机器人需要理解麻将规则,动态制定出牌、碰杠等策略,完成从规则理解到实时博弈的全流程推理与执行。
强化学习加持下的超长任务执行:R1以麻将场景为验证,完成30分钟以上的Chain of Action Thought (CoAT)长线思维链,打破传统机器人在复杂任务中的时间和思考瓶颈。
三重复合交互:实现人机、机机、机环境之间的复合交互,包括多机器人合作递牌与信息共享。
在我们的视频中,机器人可以完整打完一局大于30分钟的国标麻将,不仅可以高精度地摸牌放牌出牌,还可以理解人类意图完成碰,杠等操作,并且面对人类干扰仍然可以理解并继续牌局。
这一系列技术不仅可以用于麻将,还能泛化到多种不同灵巧操作任务当中,为后续的场景落地实际应用(如外卖袋抓取,商超补货)打了坚实基础。
解锁物流最后一百米的灵巧之手
灵初智能自主研发的Psi R1 VLA模型在提袋与穿环等物流场景中展现了卓越的闭环控制能力。系统能精准识别多种快递袋的不同摆放姿态,从多角度完成穿环提取,动作连贯流畅。
即使面对提环位置变化或垂坠等复杂情况,也能通过VLA的推理能力实时调整灵巧手姿态,确保高成功率。凭借强大的泛化性和动态性能,Psi R1不仅能执行复杂灵巧操作,还能对变形物体进行处理,为外卖、物流配送等"最后一百米"场景提供智能解决方案,让机器人服务真正走进日常生活。
商超补货的精准智能解决方案
在商超补货的商超补货涉及到将货物补隔板货架上,或挂钩上。这个流程中,放置要做到平稳且可靠,要克服几点挑战,灵初智能带触觉得灵巧手在R1模型的支持下,能跟进货物的种类规划补货的目标位置,并能精确操作,完成任务。
将货物放置到目标位置、尤其是补货到挂钩上,末端位姿与目标位置的高精度对齐到毫米级。
机械臂本体及灵巧手具有极高的重复定位精度,过程中根据物体的重心分布、形状特征、抓取力配比都要精确控制,视觉/力觉校正等手段不断补偿误差。
凭借灵巧手的高自由度动作能力与多感知融合,灵初智能不仅提升了补货作业的效率,还大幅提高了系统的作业可靠性和适应性。即便面对多样化商品形态与不断变化的环境,依然能够精准完成补货任务。
仿真环境下的强化学习与遥操作
灵初智能将仿真环境与遥操作技术相结合,有效支持VLA系统在长程灵巧操作上的训练,在麻将等复杂任务中展现出色表现。通过模仿学习与强化学习的深度融合,系统不仅大幅提升仿真数据的收集利用率,更能高效积累成功经验数据,构建起强大的数据飞轮。这种仿真到现实的技术路线,使机器人能快速掌握高难度操作技能,显著降低物理世界的训练成本与风险,让复杂灵巧操作从理论走向实践,为机器人智能发展开辟全新路径。
整机部分
PsiBot 低成本落地解决方案——单臂配合移动底盘,极低成本响应落地场景。
PsiBotV1,轮式移动+类人上半身解决方案,配合灵初智能的五指触觉灵巧手,是高效移动与灵巧操作的最优组合;全身共有32个自由度, 面向企业服务,可快速大量部署于服务业、物流业、生产制造业等领域,是落地最合理的选择。
遥操作
灵初智能最新推出的同构型外骨骼灵巧手,采用关节1比1精确映射设计,使用者仅需佩戴手套,即可自然、直观地控制机械手的每一个关节动作。这一创新设计,极大地降低了人机交互门槛,使得操作体验更加顺畅自然,动作输出精确、灵敏。
在实际应用中,灵巧手能够完成复杂的抓取动作,例如抓住快递袋的提环,稳固自然地提起袋子,动作过程中有效避免滑落或破损。系统适配不同规格的快递袋,支持多角度穿环和提手姿态调整,展现出类人级别的柔性操作能力。
高自由度外骨骼|16自由度精确控制,支持仿真强化学习训练(遥操作)
灵巧手搭载了高自由度外骨骼系统,共拥有16个自由度,能够精确同步人手复杂、多变的操作动作。这种高精度控制能力,使灵巧手不仅能完成基础动作,还能胜任更为精细复杂的操控任务。
此外,通过构建精确的仿真模型,全面支持仿真环境下的强化学习(RL)训练,可通过仿真加速灵巧手动作策略的训练与迭代,实现自主学习和性能持续优化。
3D触觉感知与力反馈|开启类人级遥操作能力(遥操作)
灵巧手在指尖区域增加了高精度的3D触觉感知模块,同时开启了外骨骼的实时力感反馈功能。
通过这些创新,操作者可以在遥操作过程中准确获取物体表面的形状、质感与施力反馈,实现真正意义上的“带感知”的遥操作。
例如,在实验中,灵巧手可通过细腻的触觉感知与力觉反馈,稳定地抓取并搬运膨化玉米棒等极其轻软、易碎的物体,充分展现出接近人手的精细操作能力。
全手触觉与力感反馈|实现盲抓材质与几何感知(遥操作)
即使在缺乏视觉辅助的条件下,灵巧手也能够依赖自身搭载的全手触觉感知和力觉反馈系统,实现对物体几何形状、表面材质的识别与判断。
在测试中,灵巧手可以盲抓不同几何特征的物体(如长方体盒子、圆柱形棒球等),并根据手部触觉信号调整抓取策略,做到动作自然、稳定可靠。
精准按需出力|安全抓取易碎物(力控,非遥操)
灵巧手搭载了高精度力控模式,可以支持根据不同物体的脆弱性,设置精准出力大小。与大脑配合,可以做到精准按需出力。
例如,在抓取豆腐这类极易破碎的物品时,系统能自主调整夹持力度,以最小必要力道稳定夹取,确保物体在抓取和移动过程中保持完好无损。
滑移自锁功能|自适应抗外力干扰(力控,非遥操)
在抓取与搬运过程中,若灵巧手感知到物体出现滑移趋势(如瓶体下滑),系统将自动增加夹持力度,激活滑移自锁机制,从而快速稳固物体,防止掉落。
这一功能使灵巧手在各种动态环境下依然能够保持高可靠性的抓取表现,大幅提升整体操作的安全性与稳定性。