论文速读 -- FIERY: Future Instance Prediction in Bird’s-Eye View from Surround Monocular Cameras

论文速读 – FIERY: Future Instance Prediction in Bird’s-Eye View from Surround Monocular Cameras

参考
1. 知乎FIERY

一. 摘要

驾驶需要与道路参与者互动,并预测他们未来的行为,以便安全驾驶。我们提出了FIERY:一个概率未来预测模型基于单眼相机BEV视角。我们的模型预测了未来的实例分割和动态运动,可转化为非参数未来的轨迹。我们的方法结合了传统自动驾驶感知、传感器融合和预测组件,以多视角RGB单目相机作为输入估计鸟瞰图预测。该模型在不依赖高清地图的情况下,仅以端到端的方式从相机驱动数据预测未来,并预测多模态未来轨迹。

二. 介绍

前融合这一重要理论被证实了,可以有效改善感知表现,如目标检测。大部分基于相机的预测工作都直接表现在感知视角所在坐标系,或者在高精度地图系统中生成简易的BEV栅格表征。传统预测任务更多是基于高精度地图或者使用道路关系,生成未来轨迹。

相关工作
相机数据BEV视角表征。
未来预测。检测-追踪-预测模型存在累计误差,延迟高。大部分端到端的方式重度依赖于lidar数据,并结合高精度地图,紧密编码,表现更好。我们的工作是第一个直接以图像视频作为输入,预测不同物体的合理未来轨迹,有别于以往的自上而下的栅格化表征。

主要贡献

  1. 首次提出BEV视角下的单目相机视频的未来预测模型,有充分理由证实了可以 动态预测实例分割和运动。
  2. 我们的概率模型能够预测动态环境下的可信的且多模型参与的未来轨迹。
  3. 定量化的对未来动态场景分割表现,超越现有基线。

三. 模型

在这里插入图片描述

3.1 拉伸图像特征到3D

LSS方案,可参考Lift,splat,shootEfficientNet用来获取拉伸特征和离散的深度概率。

3.2 投影到BEV视角

实验采用0.5m分辨率,针对100m*100m范围,得到(H,W)=(200,200)。

3.3 学习时序表征

利用过去时刻的多帧BEV特征{x} 与自运动坐标变换{a},将过去多帧特征变换到当前帧车身坐标系,得到时空状态输出s。然后对其进行3D卷积。

3.4 当前和未来分布

当前分布只能由当前时空状态s得到,而未来分布F额外附加上可以观测的未来标签,标签关联着未来中心、偏移、分割和流。我们使用对角高斯函数来拟合这两个分布,训练模型期间,从未来分布中采样隐藏状态,推理期间则从当前分布中采样隐藏状态。KL散度loss使用当前分布覆盖可见未来状态。

3.5 BEV视角下的未来预测

未来预测模型采用conv-GRU单元网络,以当前状态和从未来分布中采样的隐状态作为输入,或者推理阶段从当前分布中采样。

3.6 未来实例分割和运动

BEV最终解码,输出得到是包含多头:语义分割、实例中心、实例偏移、未来实例流

3.7 loss

语义分割:topk交叉商 loss
实例中心:L2 loss
实例偏移、未来实例流: L1 loss


四. 实验

4.1 数据集

lyft 和 nuscenes

4.2 评价指标

VPQ(Future Video Panoptic Quality): 未来视频全景质量。
1)识别质量:随时间推移,检测目标的一致性。
2)分割质量:实例分割的精确度。
公式如下:
在这里插入图片描述

Dged(Generalised Energy Distance)一般能量距离

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
### 回答1: "Mit-Cheetah-Note"是一种学习辅助工具,旨在提高学生的学习效率和效果。它结合了MIT(麻省理工学院)的学习方法和猎豹速读技术。 首先,MIT-Cheetah-Note采用了麻省理工学院的学习方法。这些方法包括主题导图,问题解决和概念联系等。主题导图是一种可视化的学习工具,帮助学生整理和理解知识点之间的关系。问题解决则鼓励学生通过提出问题来主动思考和深入理解知识。概念联系是通过将新知识与已有知识相结合,加深学生对知识的理解。 其次,这个学习工具还集成了猎豹速读技术。速读是一种训练阅读效率和记忆力的技巧。通过使用猎豹速读技术,学生可以提高阅读速度和理解能力。这对于大量阅读任务的学生来说尤其有用,如备考、论文写作等。 MIT-Cheetah-Note采用了数码笔和智能设备相结合的方式进行学习记录和储存。学生可以使用数码笔在纸上做笔记,并通过智能设备将这些笔记同步到云端。这样一来,学生可以随时随地访问他们的学习记录,从而更好地回顾和复习。 总而言之,MIT-Cheetah-Note是将麻省理工学院的学习方法和猎豹速读技术融入一体的学习辅助工具。它帮助学生提高学习效率和效果,并通过数字化技术方便学生的学习记录和辅助复习。 ### 回答2: Mit-Cheetah-Note 是一种人工智能语音助手,最初由麻省理工学院(MIT)研发。该技术基于深度学习和自然语言处理,在提供智能语音交互的同时,还具备类似于记事本的功能。 Mit-Cheetah-Note 可以用于多个方面,例如记录会议笔记、制定待办事项、管理日程安排等。用户可以通过语音指令来创建笔记,编辑文本内容或者提醒自己日程。Mit-Cheetah-Note 还能理解自然语言,对语音指令做出准确的响应,从而提高用户的工作效率。 与其他语音助手相比,Mit-Cheetah-Note 的特点是其记事本功能。用户可以通过语音输入方式,较快地记录需要记下的信息,而无需手动键入。此外,Mit-Cheetah-Note 还有一个方便的搜索功能,可通过关键词搜索用户之前创建的笔记内容,帮助用户快速找到所需的信息。 Mit-Cheetah-Note 可以应用于多种场景,如商务会议、学术讲座、个人笔记等。它不仅可以减少记笔记的时间和工作量,还可以提高笔记的准确性和完整性。 总之,Mit-Cheetah-Note 是一种集成了语音助手和记事本功能的人工智能技术,使用户能够通过语音指令快速记录信息和管理日程,提高工作效率。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Darchan

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值