Figure 02配备了机载的视觉语言模型(VLM),使其能够进行快速的常识性视觉推理。



“地表最强”人形机器人亮相:视觉&语音推理能力_语言模型



相关:

 https://mbd.baidu.com/newspage/data/landingsuper?context={"nid"%3A"news_9166295958664754028"}&n_type=-1&p_from=-1