![](https://img-blog.csdnimg.cn/20201014180756754.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
论文翻译
文章平均质量分 93
溯源006
以出世之心,行入世之事。躬耕于人工智能领域,特别是热衷于通用人工智能。
展开
-
【论文翻译】Semantic Abstraction: Open-World 3D Scene Understanding from 2D Vision-Language Model【未完】
我们研究开放世界3D场景理解,这是一个系列的任务,要求代理使用开放词汇和域外视觉输入来推理其3D环境的任务,这是机器人在非结构化3D世界中操作的关键技能。为此,我们提出了语义抽象(SemAbs),这是一个为2D视觉语言模型(vlm)提供新的3D空间能力的框架,同时保持其zero-shot鲁棒性。我们使用从clip中提取的关联图来实现这种抽象,并以语义不可知的方式在这些抽象的基础上学习3D空间和几何推理技能。我们证明了SemAbs在两个开放世界3D场景理解任务中的有用性:1)完成部分观察的对象和2)从语言描述原创 2023-10-28 20:23:07 · 247 阅读 · 0 评论 -
【论文翻译】RT-1: ROBOTICS TRANSFORMER FOR REAL-WORLD CONTROL AT SCALE【未完待续】
这种模型成功的关键在于。原创 2023-10-09 22:18:28 · 757 阅读 · 1 评论 -
【论文翻译】Open X-Embodiment: Robotic Learning Datasets and RT-X Models【未完待续】
在不同数据集上训练的大型高容量模型在有效处理下游应用程序方面取得了显著成功。在从NLP到计算机视觉的领域,这导致了预训练模型的整合,一般的预训练backbones作为许多应用程序的起点。这样的整合会发生在机器人领域吗?传统上,机器人学习方法为每个应用程序、每个机器人甚至每个环境训练一个单独的模型。我们是否可以训练“通才”X机器人策略,使其能够有效地适应新的机器人,任务和环境?在本文中,我们提供了标准化数据格式和模型的数据集,以便在机器人操作的背景下探索这种可能性,以及提供有效X机器人策略示例的实验结果。原创 2023-10-09 21:41:42 · 282 阅读 · 1 评论