丰田研究院在计算机视觉国际会议上宣布机器学习进展

最新推荐文章于 2024-10-14 10:45:00 发布

alove110

最新推荐文章于 2024-10-14 10:45:00 发布

阅读量466

点赞数

文章标签：自动驾驶深度学习机器学习

本文链接：https://blog.csdn.net/suwenglong110/article/details/120801466

版权

TRI 在计算机视觉顶级国际会议上发表六篇研究论文推动可扩展学习的边界

今天，丰田研究院 (TRI) 在国际计算机视觉会议 (ICCV) 上宣布接受机器学习领域的六篇研究论文。该研究促进了对机器人感知至关重要的各种任务的理解，包括语义分割、3D 对象检测和多对象跟踪。

在过去的六年里，TRI 的研究人员在机器人技术、自动驾驶和材料科学方面取得了重大进展，这在很大程度上归功于机器学习——计算机算法的应用随着经验和数据不断改进。

“机器学习是我们研究的基础，”TRI 首席执行官 Gill Pratt 博士说。“我们正在努力在机器学习本身的学科中创造科学突破，然后应用这些突破来加速机器人、自动驾驶以及电池测试和开发方面的发现。”

随着计算机视觉国际会议 (ICCV) 的开始，TRI 分享了六篇论文，展示了 TRI 在机器学习方面的强大研究，包括用于 3D 视觉的几何深度学习、自监督学习和模拟到真实或“模拟到真实”的转移。

“在机器学习领域，可扩展监督是我们的重点，”TRI 机器学习团队负责人 Adrien Gaidon 说。“不可能以丰田的规模手动标记您需要的一切，但这是最先进的方法，尤其是对于深度学习和计算机视觉。值得庆幸的是，我们可以利用丰田在车辆、机器人或电池方面的专业知识来发明可扩展监督的替代形式，无论是通过模拟还是从原始数据中进行自我监督学习。这种方法可以提高各种任务的性能，这些任务对于自动驾驶汽车在任何时候都更安全、机器人更快地学习和电池开发以加快漫长的测试周期很重要。”

在ICCV接受的六篇论文中，TRI 研究人员报告了几个关键发现。值得注意的是，他们表明几何自监督学习显着改善了场景理解的模拟到真实转移。由此产生的无监督域自适应算法能够识别真实世界的类别，而无需任何昂贵的手动真实世界标签。

此外，TRI 对多对象跟踪的研究表明，合成数据可以赋予机器基本的人类认知能力，例如对象永久性，这在历史上对机器学习模型来说是难以实现的，但对人类来说却是第二天性。这一新发展提高了计算机视觉算法的稳健性，使其更符合人们的视觉常识。

最后，TRI 对伪激光雷达的研究表明，大规模自监督预训练大大提高了基于图像的 3D 目标检测器的性能。所提出的几何预训练可以从有限的 3D 标签中训练强大的 3D 深度学习模型，这些标签很昂贵，有时甚至无法仅从图像中获得。

您可以在TRI 的 Medium 页面上了解有关所有六篇论文和 TRI 机器学习工作的更多信息，或者参加 TRI 在 ICCV 上的演讲。

关于丰田研究所

丰田研究院 (TRI) 开展研究以推进机器人、能源和材料、机器学习和以人为本的人工智能。在 Gill Pratt 博士的带领下，TRI 的世界级研究人员团队正在开发技术来增强人类的能力，专注于让我们的生活更安全、更可持续。TRI成立于2015年，在加利福尼亚州洛斯阿尔托斯设有办事处；马萨诸塞州剑桥；和密歇根州安娜堡。有关 TRI 的更多信息，请访问http://tri.global。