自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

techflowai的博客

数据集汇总

关注

关注数：文章数：1 文章阅读量：0 文章收藏量：0

作者: 智驾机器人技术前线

公众号【智驾机器人技术前线】博主

展开

超越现有数据集：CoVLA如何推动自动驾驶技术革新？

自动驾驶领域面临许多不可预见的场景，这要求系统具备复杂的推理和规划能力。虽然多模态大语言模型（MLLMs）为此提供了一个有希望的途径，但它们主要用于理解复杂的环境背景或生成高级驾驶指令，很少有研究将其应用扩展到端到端的路径规划。一个主要的研究瓶颈是缺乏包含视觉、语言和动作的大型注释数据集。为了解决这个问题，我们提出了CoVLA（全面视觉-语言-动作）数据集，这是一个包含超过80小时真实驾驶视频的广泛数据集。

原创 2024-09-03 19:33:53 · 526 阅读 · 0 评论