硬核突破 | 「机器人通用模型π0」重磅升级,学习效率“提升5倍”,VLA加速迈向“新纪元”!
原创 AI产品汇 AI产品汇 2025年01月18日 07:50 广东
“毫无疑问,VLA模型(视觉-语言-行为)已经成为了具身智能中最火的一个研究方向之一,很多学者们也认为VLA是通往真正的具身智能的一条可行的路。由物理智能发布的π0曾经掀起了很长一段时间的热潮,机器人开始能够帮你完成从洗衣机取衣服、叠衣服、收纳衣服等复杂任务。众所周知,良好的标记化选择对序列模型的性能至关重要。之前的这类机器人策略通常使用基于每维度、每时间步分箱方案的标记化策略。作者发现,在学习需要高频控制的灵巧技能时,这种方法通常表现不佳。本文提出了一种基于离散余弦变换的机器人动作标记化方案FAST,基于FAST,作者发布了FAST+,这是一个通用的