AI机器人日记-CSDN博客

原创【机器人】首次提出！CMU仅用RGB摄像头，远程操控人形机器人，实现人机合一

【日记导读】本篇论文的中心思想是提出了一种名为H2O的框架，它利用强化学习实现了人类动作到人形机器人的实时、全身远程操控。

2024-04-08 11:51:50 1995

原创【机器人】MIT、UCLA联合发布3D-VLA，重塑机器人的世界观，打造未来智能生活

本文提出了3D-VLA，一种新型的3D视觉-语言-行动生成世界模型，旨在通过整合3D感知、推理和行动，显著提升机器人在物理世界中的交互能力。以往的视觉-语言-行动（VLA）模型(RT2, PaLM-E)主要依赖于2D输入，忽略了与3D物理世界的广泛联系，且在行动预测上缺乏对世界动态及其与行动关系的深入理解。相比之下，人类能够借助内在的3D世界模型来模拟未来事件，从而更好地规划行动。3D-VLA通过引入一个新的具身基础模型家族，无缝连接3D感知、推理和行动，解决了这些问题。具体来说，3D-VLA建立在3D

2024-04-03 11:51:29 2092

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

2401_84005497的博客

原创【机器人】首次提出！CMU仅用RGB摄像头，远程操控人形机器人，实现人机合一

原创【机器人】MIT、UCLA联合发布3D-VLA，重塑机器人的世界观，打造未来智能生活

原创【机器人】用LLM让谷歌机器人表达丰富的肢体语言GenEM技术让机器化身为社交达人

原创【机器人】谷歌机器人从人类反馈中微调大模型来提高机器人执行任务的适应性

原创【机器人】UIUC、北大、亚马逊提出基于动作的场景图，让机器人理解和操控未知环境

空空如也

空空如也

原创 【机器人】首次提出！CMU仅用RGB摄像头，远程操控人形机器人，实现人机合一

原创 【机器人】MIT、UCLA联合发布3D-VLA，重塑机器人的世界观，打造未来智能生活

原创 【机器人】用LLM让谷歌机器人表达丰富的肢体语言GenEM技术让机器化身为社交达人

原创 【机器人】谷歌机器人从人类反馈中微调大模型来提高机器人执行任务的适应性

原创 【机器人】UIUC、北大、亚马逊提出基于动作的场景图，让机器人理解和操控未知环境

空空如也

空空如也

原创【机器人】首次提出！CMU仅用RGB摄像头，远程操控人形机器人，实现人机合一

原创【机器人】MIT、UCLA联合发布3D-VLA，重塑机器人的世界观，打造未来智能生活

原创【机器人】用LLM让谷歌机器人表达丰富的肢体语言GenEM技术让机器化身为社交达人

原创【机器人】谷歌机器人从人类反馈中微调大模型来提高机器人执行任务的适应性

原创【机器人】UIUC、北大、亚马逊提出基于动作的场景图，让机器人理解和操控未知环境