BEV
文章平均质量分 91
WeissSama
写清楚 搞清楚
展开
-
【BEV】3D视觉 PRELIMINARY
由于图像坐标系和像素坐标系处于同一平面,故两者之间的差异在于坐标原点的位置和单位。像素坐标系的原点在图像坐标系的左上角,同时像素坐标系的单位为像素。一根柱子从BEV平面升起,柱子内的一个三维点被投影到相机视图上。投影过程涉及到世界World、相机Camera、图像Image和像素Pixel坐标系之间的转换。从世界坐标到相机坐标的转换是一种刚性变换,只需要平移和旋转(更详细的可以看上面的博客)。给定P的世界坐标和相机的内在参数和外在参数,可以得到。分别对应于柱上的三维点和摄像机视图上投影的2D点。原创 2023-08-15 17:36:17 · 361 阅读 · 0 评论 -
【BEV Camera-based】View Transformations 论文之FB-BEV,BEV Representation from Forward-Backward。
为了解决由2D-3D投影产生的稀疏BEV表示的问题,我们利用3D-2D投影方法从之前的3D-2D投影中细化稀疏区域。然而,正如我们上面所介绍的,由于缺乏深度引导,3D-2D投影的投影容易出现假阳性特征。另外,对于目标检测任务,我们只关心前景对象,所以我们在使用3D-2D投影时,只关注BEV平面的前景区域,这样可以减少背景部分的false positive,减少计算负担。A点的预测深度分布为α。值得注意的是,对于任何3D点(λx,λy,λz),其中λ∈R+,它们在2D图像上共享相同的投影点(u,v)。原创 2023-08-15 15:58:19 · 1061 阅读 · 1 评论 -
【BEV Review】论文 Delving into the Devils of Bird’s-eye-view 2022-9 笔记
在仅使用相机的三维感知的初期,主要的焦点是如何从2D感知空间预测三维物体的位置。从学术的角度来看,设计一个基于相机的pipeline,使其性能优于激光雷达的本质,是更好地理解从二维视角输入到三维几何输出的视图转换过程。在视图转换的背景下,OFTNet 首先引入了3D-2D方法,即从3D到2D的特征投影,它将2D特征投影到体素空间(3D空间),首先引入了2D-3D方法,预测二维特征上每个网格的深度分布,然后通过相应的深度将每个网格的二维特征“提升”到体素空间,并采用基于lidar激光雷达的方法执行下游任务。原创 2023-08-14 17:01:28 · 482 阅读 · 0 评论