2020.6.23,ICRA2020中关于重建的论文 一

《A Hierarchical Framework for Collaborative Probabilistic Semantic Mapping》

构建高质量的全局语义图。

Introduction

语义建图包含几何建图和语义建图,这对于路径规划和导航至关重要。
单机器人语义建图已经引起了很多关注[4],[5]。
Pyramid scene parsing network 2017
Octree map based on sparse point cloud and heuristic probability distribution for labeled images 2018
协作机器人,已经提出了执行协作几何映射的方法[6],[7]
A multi-level fusion system for multi-robot 3d mapping using heterogeneous sensors 2019
Probabilistic fusion framework for collaborative robots 3d mapping 2018
本文协作概率语义建图。
协作式3D语义建图尝试将各个机器人生成的语义建图(即局部建图)融合到全局语义建图中[8]。
该论文提出了一种新颖的协同语义建图框架。

A Unified Framework for Piecewise Semantic Reconstruction in Dynamic Scenes via Exploiting Superpixel Relations

基于超像素的、针对动态环境的、稠密、语义重建。包含复杂的背景和运动对象。
我们利用两种超像素关系:运动关系和空间关系,每种都有三个子类别:coplanar, hinge,、crack.

Introduction

在动态场景中进行稠密单目重建是计算机视觉中的一项艰巨任务:尺度模糊
重建是许多高级应用程序中的重要步骤(例如,自动驾驶[3],机器人导航[4],场景理解[5]),
最近提出了各种基于SFM或深度学习技术的重建方法,它们已在许多具有挑战性的数据集上取得了较好的结果。 但是,他们仍然无法处理不同类型的更复杂的场景。

在基于深度学习的方法中,我们主要关注无监督学习方法[7],[8],[9],这些方法不需要真实深度,因为深度信息很难在复杂场景中收集。 与我们的方法类似,Struct2depth [9]也将语义分割结果作为输入。
Unsupervised learning of depth and ego-motion from video, 2017
Geonet: Unsupervised learning of dense depth, optical flow and camera pose, 2018
Depth prediction without the sensors: Leveraging structure for unsupervised learning from monocular videos 2019
目前,无监督学习方法仅在交通场景中成功,但在更具挑战性的场景(例如MPI Sintel)中,其性能仍然远远不够理想。

对于基于SFM的方法[11],[1],[12],他们提出了强有力的假设来解决RSA问题。
Dense monocular depth estimation in complex dynamic scenes 2016
Monocular dense 3D reconstruction of a complex dynamic scene from two perspective frames 2017
Monocular piecewise depth estimation in dynamic scenes by exploiting superpixel relations 2019
假设有许多缺点。

框架

输入图像 I t I_t It I t + 1 I_{t+1} It+1,目标是估计 I t I_t It的深度图 D t D_t Dt
我们首先估计初始的像素匹配 M = { p i , p j } M=\{p_i,p_j\} M={pi,pj},其中 p i ∈ I t p_i\in I_t piIt p j ∈ I t + 1 p_j \in I_{t+1} pjIt+1
然后我们将图像过度分割为不重叠的超像素集合 S = { S 1 , . . . , S n } S=\{S_1,...,S_n\} S={S1,...,Sn} n n n是超像素的个数。
对于超像素 S i S_i Si H i ∈ R 3 × 3 H_i \in R^{3×3} HiR3×3表示其单应性模型, θ i ∈ R 3 \theta_i \in R^3 θiR3指代其平面参数 s i s_i si指代其尺度。
给定相邻的超像素 S i S_i Si S j S_j Sj R e ( i , j ) R_e(i,j) Re(i,j)表示它们的运动关系, R s ( i , j ) R_s(i,j) Rs(i,j)表示它们的空间关系, B i j B_{ij} Bij表示共享边界上的像素。 对于像素 p i p_i pi P i P_i Pi是其homogeneous表示。 在本文中,项 λ ∗ λ_∗ λ表示每个能量项的权重, τ ∗ \tau_* τ表示阈值, ω ∗ \omega_* ω表示每个项的权重。

在这里插入图片描述
连续的RGB图像作为输入
i)预处理:使用PatchMatch [21]方法计算初始匹配,并使用SLIC [22]进行过度分割,采用深度学习网络进行语义分割。
ii)运动估计:联合估计 homographies和运动关系
iii)关系分析:结合语义信息和运动关系来预测空间关系。
iv)重建和完善:估计平面参数并为每个超像素分配相对比例。我们在最后一个细化步骤中应用像素级细化。

A Volumetric Albedo Framework for 3D Imaging Sonar Reconstruction

使用声呐传感器进行对象级3D水下重建。

Actively Mapping Industrial Structures with Information Gain-Based Planning on a Quadruped Robot

在线主动建图系统,可以使四足机器人自主测量大型物理结构。

Introduction

机器人领域,主动感知技术。
尽管主动制图已针对许多应用进行了研究,例如检查[1]和虚拟建模[2],以及在各种机器人平台上,例如空中[3],[4],轮式[5],[6]和水下机器人[ [7],[8]中,在真正的机器人上在线部署这样的系统仍然是一个挑战,因此需要进一步研究。

我们的方法是建立并维护目标物体以及局部环境的准确3D模型,并使用它来规划四足机器人的移动路线以对地图进行细化与拓展 。
我们的主动映射框架采用了[5]中最初提出的信息增益(IG)方法,

Related work

模型表达方法:
许多主动制图系统采用表面网格或体素空间表示。
诸如[14],[15]:同时使用了两者。
[1]和[8]利用表面网格来精确地重建船体,网格提供有关表面覆盖范围,边界和孔的信息。
[16]使用粗糙的数字表面模型(DSM)作为先验地图来计划无人机的视点。
在体积方法中,通常使用诸如IG之类的视图选择指标来确定NBV:
[3],[13]利用体积表示法和后退的地平线规划策略逐步探索未知环境。
[5]建议收集体积信息(VI)的措施。
4]然后进行了更多的实验,将它们的VI配方与[15]和[18]的方法进行比较,以确定以体积表示的NBV选择的最佳选择

framework

在这里插入图片描述
LIDAR的测量值 L B L_B LB,然后存储在基础框架 { B } \{B\} {B}中。扫描期间,基于当前机器人的位姿,将 L B L_B LB转换到地图框架下 { M } \{M\} {M},以获得一个大的积累点云。
在我们的系统中,累积的点云表示为sweep S M S_M SM。 然后对 S M S_M SM进行下采样以获得均匀性,并进行过滤去除异常值。 接下来,系统使用已处理的sweep S M S_M SM以及机器人 的 姿 态 x M 的姿态x_M 姿xM来更新其OctoMap中体素的占用概率。
我们还使用LiDAR测量来生成环境的高程图。 高程图的有用范围约为10 m,仅允许进行局部规划。
路径规划模块根据海拔图评估地形的可穿越性,并构建RRT以生成扫描候选的集合 C C C。其中的扫描候选 c ∈ C c \in C cC是机器人进行下一个扫描的位置。
我们使用有效函数 U c U_c Uc从候选集合 C C C中,确定最佳扫描候选(NBV) c b e s t c_{best} cbest

Autonomous Navigation in Unknown Environments using Sparse Kernel-based Occupancy Mapping

为了机器人能够在未知环境中进行导航与碰撞检测,我们提出了一个新的地图表示形式。

Introduction

自主导航涉及在局部已知的环境中进行定位,建图,运动规划和控制,这些环境可以通过来自车载传感器的流数据[1],[2]来感知。 在本文中,我们关注于建图问题,尤其是实现大规模但紧凑的表示以及有效的碰撞检查以支持自主导航。 现有作品使用基于体素[3],[4],[5],[6],冲浪[7],几何图元[8],对象[9]等的各种地图表示。我们提出了一种新颖的映射 使用内核感知器模型来表示环境的已占用和可用空间的方法。
该模型使用一组支持向量来表示配置空间中的障碍物边界。 此表示的复杂性与障碍物边界的复杂性成比例,而不是与环境大小成比例。 我们开发了一种在线训练算法,以随着机器人传感器提供的对周围环境的新深度观察而逐步更新支持向量。 为了在新的占用状态下实现运动规划,我们针对配置空间中的分段线性和分段多项式轨迹开发了一种有效的碰撞检查算法。

框架

在这里插入图片描述
i) 在工作空间中扫描
ii) 在配置空间 C C C中扫描
iii) 从扫描中进行采样
iv) 增加的自由点
v) 来自一次激光扫描的训练数据
vi) 分数 F ( x ) F(x) F(x)产生的确切决策边界和上限 U ( x ) U(x) U(x)产生的膨胀边界;
F(x)和U(x)沿两条射线:(g)一条进入占用的空间,(h)一条保持无障碍。

Ensemble of Sparse Gaussian Process Experts for Implicit Surface Mapping with Streaming Data

为了进行规划与导航,从已知姿态的深度数据流(SDF)中,学习并创建环境紧凑且连续的隐式表面地图。

Introduction

标准的机器人建图方法是 估计占用概率的离散模型[1],尽管简单明了,但由于每个cell都是单独考虑的,因此泛化效果很差。
相反,基于隐式表面表示的连续模型可以在稀疏观测之间进行插值,并利用先验信息[2]。 但是,当前的最新技术在数据或覆盖空间的大小方面无法很好地扩展[3],[4],[5]。
实际上,在连续表示方法在实践中变得有意义之前,仍需要对有关底层表示和学习算法的基本问题进行更多研究。
将连续表示模型应用于机器人场景的一个关键的开放挑战是测量值是按顺序到达的,因此有必要有效地增量构建和更新地图。

隐式表面估计 作为高斯过程回归

我们的目标是在一个以SDF表示的环境中,估计表面位置。
对于SDF的回归,我们获得测量 ( x , y ) (x,y) (x,y),由位置 x ∈ R 2 x \in R^2 xR2和有符号距离值 y ∈ R y\in R yR组成。
距离传感器提供给我们具有噪声的表面测量——具有0距离值的位置集合 X s u r f X_{surf} Xsurf
结合传感器位姿,我们构建额外的 辅助测量值 X a u x X_{aux} Xaux,这些测量位置在表面前方0.1以内。
X m = X s u r f U X a u x X_m =X_{surf} U X_{aux} Xm=XsurfUXaux

对于SDF的GP回归,我们假设测量数据被噪声破坏,即 y i = f ( x i ) + ϵ y_i=f(x_i)+\epsilon yi=f(xi)+ϵ,其中 ϵ \epsilon ϵ符合正态分布。为了预测在位置 x ∗ ∈ X ∗ x_*\in X_* xX的SDF值,我们首先选择一个联合先验分布
。。。

Hybrid Topological and 3D Dense Mapping through Autonomous Exploration for Large Indoor Environments

为了机器人进行自主导航与路径规划,机器人需要对环境的3D结构有详细的了解。
提出了一种新颖的建图方法,该方法能够使用标准CPU为大型室内环境构建和维护3D密集表示。全局混合地图包括 :拓扑全局表示和3D密集子图。

地图表示方法

在这里插入图片描述
混合图:包括不同位置中的子图,已建图区域的拓扑图。
我们的混合地图包含两个拓扑图和3D密集子图。
第一个拓扑图,即自由区域图,表示可穿越区域,并将其分类为自由区域或过境区域。 拓扑图的相邻节点可以在可遍历区域内以一条直线到达。 运输区域用于确定机器人是否在两个地方之间切换。
第二张拓扑图收集了已识别的不同地点及其在过境地区之间的联系。 为每个地方都建立了3D子图。
在这项工作中,将门用作过境区域,将房间标识为场所,但是对于其他环境(即,户外驾驶环境的道路交叉口),可以对它们进行不同的定义。

Related work

传统上,混合度量-拓扑建图因其在管理信息方面的效率而闻名。
目前已经有多种混合建图的方法。根据创建的结构对相关工作进行了分类:
第一组,同时构建全局度量图和拓扑图 [3],[4],[5]。 作为Zhang [3]的工作,先建立了一个全局度量图,然后从环境的度量结构中提取了一个拓扑图Voronoi图。 在[6]中,作者维护了全局拓扑和度量图(建立在拓扑图的骨架上)和度量本地图,用于网关和交叉路口。
第二组:从全局度量图构建拓扑图,然后将其划分为局部度量图 [7], [8], [9].
第三组:构建拓扑图与局部度量子图 [10], [11], [12], [13], [14], [15], [16],
[17].

Informative Path Planning for Active Field Mapping under Localization Uncertainty

考虑机器人的不确定性是创建鲁棒、高质量地图的隐含要求。
本文为主动建图 引入了一个informative规划框架,该框架明确考虑了制图和规划任务中姿态的不确定性。

Keyframe-based Dense Mapping with the Graph of View-Dependent Local Maps

使用RGB-D传感器的基于关键帧的建图系统。
使用来自RGB-D传感器的数据更新局部正态分布变换图(NDT)。 NDT的单元存储在2D视图相关的结构中,以更好地利用RGB-D相机的属性和不确定性模型。
局部图存储在pose graph中,该图允许在闭环检测之后校正全局图。

Introduction

为了自主机器人能够进行碰撞检测,运动计划和定位,需要使用地图对环境进行建模。环境模型允许进行碰撞检测,运动计划和定位。
最受欢迎的3D密集映射方法是Octomap [4]和==NDT-OM ==[5]。
OctoMap: An efficient probabilistic 3D mapping framework based on octrees 2013
3D normal distributions transform occupancy maps: An efficient representation for mapping in dynamic environments, 2013
两种方法都将构建一个全局地图,该地图将空间划分为体素并确定其占用率,体素的大小必须预先确定,且该尺寸关系到任务的精度与空间中体素的数量。

在本文中,我们提出了一种针对静态环境的密集建图方法,该方法受ORB-SLAM启发。 没有创建环境的全局图,而是创建了一组与相机的唯一视图(关键帧)有关的局部图(图1)。 我们将来自RGB-D传感器的深度测量结果集成到相机框架中,从而可以比远处的物体更精确地表示距离相机更近的物体。 尽管局部帧中的分辨率始终保持不变,但我们可以以各种精度表示3D空间的相同区域,并且不会丢失有关对象细节的信息。
最后,我们可以生成环境的全局图,并在循环关闭后更正该图。
在这里插入图片描述
环境的局部地图,投影在图像平面上的normal distribution transforms(椭球)

frame work

在这里插入图片描述

Map Management Approach for SLAM in Large-Scale Indoor and Outdoor Areas

一个针对不同环境的语义地图管理方法(不同的地图是通过改变SLAM配置实现的)
模块化的地图管理允许添加、修改或者删除地图,而不影响其他地图。
单个独立的地图通过链接点连接,这些链接点位于两个地图的重叠区域中。
使用基于特征的匹配和点云之间的迭代最近点(ICP)进行配准。
通过基于外观的方法来检测地图之间的闭环。
根据地图和链接点的布置,提取拓扑图以进行导航。

Introduction

当移动机器人在非常大型的建筑物中运行时,用一个特定的传感器和参数配置创建单个地图似乎是不合理的。 另外,通过单个地图方法很难解决由电梯连接的多个楼层的导航。 本文通过提出一种建图方法解决了这个问题,该方法通过评估距离传感器数据以识别出门口通过,从而自动检测新房间或室内/室外变化。 机器人进入新房间/环境后,将创建新地图。 此外,该算法能够从预先定义的列表中自动选择最佳传感器和SLAM配置以进行建图。
在这里插入图片描述
地图管理方法的度量-拓扑图结构:通过门后自动触发新地图的创建。 然后通过链接点(红色圆圈)连接地图。 链接点通过边(红线)连接。 带有绿色和蓝色(左侧)的图是使用不同的SLAM配置生成的。

Motion Estimation in Occupancy Grid Maps in Stationary Settings Using Recurrent Neural Networks

使用递归神经网络将城市环境中的车辆环境建模为动态占用网格图。
动态occupancy grid maps以鸟瞰图表示场景,其中每个栅格单元都包含占用概率和二维速度。
使用测量网格图作为输入数据,其中包含使用激光雷达测量结果生成的占用概率。

Introduction

为了进行自动驾驶,需要对环境进行建模与理解。
一个最为常用的环境表示方法为occupancy grid map。 每个单元与一个物理位置相关联,并包含占用概率,即被一个物体占据的概率。 在早期的工作中,由于静态环境的必要假设,网格地图主要应用于机器人地图绘制[1]。
最近,几篇著作[2],[3],[4],[5]将静态网格图扩展到了动态环境,速度已经引入了cell状态。
此外,[2],[3],[4],[5]在预测步骤中采用等速模型,导致动态驾驶场景下的性能下降,例如 刹车并转向。

Methed

介绍在占用网格图中,进行运动估计的方法。 我们依靠一系列测量网格图作为输入来预测动态占用网格图,即占用概率和速度。

Probabilistic TSDF Fusion Using Bayesian Deep Learning for Dense 3D Reconstruction with a Single RGB Camera (基于深度学习的单目重建算法)

单个RGB图像的深度预测解决了3D重建问题。
目前基于深度学习的深度预测取得了不错的效果,但是由于训练环境和测试环境之间存在差异,因此3D重建可能会受到深度预测不确定性的影响。
考虑到深度预测的不确定性,我们提出了一个轻量级的贝叶斯神经网络。进行更准确地全局TSDF 3D重构。

Introduction

在自主导航的系统中,移动机器人需要对周围环境进行3D重建。
单摄像头在自治系统中的应用得到了积极的研究[1] – [3]:经济,轻巧和直观。 但是,使用单个摄像机进行3D重建存在固有的问题:i)无特征环境下难以找到密集匹配关系,ii)无法测量绝对尺度。
为了克服这些缺点,引入了使用深度学习从单个图像进行深度估计的方法[4] – [7]。 使用这种方法,即使在没有纹理的环境中也可以估计密集深度图像,并且还可以解决比例尺模糊问题。
使用深度预测进行密集3D重建和跟踪的主要方法有三种。
首先,仅针对关键帧预测密集深度,然后通过查找关键帧与当前帧之间的几何对应关系来确定深度[8],[9]。
其次,稀疏深度是通过通用的视觉测距算法获得的,并用于改善深度预测的性能[10]。 第三,就像使用RGB-D相机一样,使用RGB图像和估计的深度图像对执行RGB-D SLAM [7]。
我们跟随最后一个流使用深度预测执行密集的3D重建。 然而,与现有的基于点融合的3D重建方法不同[7],我们基于截短的符号距离函数(TSDF)融合执行密集的3D重建。 通过使用TSDF融合,可以通过加权移动平均值来减轻数据噪声,并且可以使用光线投射或行进立方体算法轻松地从全局TSDF映射中提取3D表面。 另外,可以考虑传感器噪声模型来执行概率TSDF融合,以对噪声进行更鲁棒的3D重建[11],[12]。

  • 2
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值