论文解析 - SemanticFusion: Dense 3D Semantic Mapping with Convolutional Neural Networks

SemanticFusion: Dense 3D Semantic Mapping with Convolutional Neural NetworksICRA2017 论文梳理整体框架的组成为三个部分:A real-time SLAM system ElasticFusion A Convolutional Neural Network A Bayesian update...
摘要由CSDN通过智能技术生成

SemanticFusion: Dense 3D Semantic Mapping with Convolutional Neural Networks

ICRA2017

 

论文梳理

整体框架的组成为三个部分:

  1. A real-time SLAM system ElasticFusion
  2. A Convolutional Neural Network
  3. A Bayesian update scheme

其中过程如下:

               CNN接收2D图像并且返回每个像素的分类概率分布,然后贝叶斯更新模型将跟踪每个曲面的分类概率分布,然后使用SLAM系统提供的数据关联来基于CNN的预测更新这些概率。(SLAM系统提供了什么样的数据关联?)最后,我们使用CRF regularisation框架来使用地图自身的尺度信息来改善语义预测。

接下来将详细介绍。

 

A. SLAM Mapping

选择ElasticFusion作为SLAM系统。对于每一帧k,ElasticFusion通过结合ICP和RGB的匹配来跟踪相机姿态(实际上ICP匹配即考虑位置信息,RGB匹配考虑外表相似信息。),来得到新的姿态。使用这个相机姿态,在地图中加入新的点元(surfels),同时更新已存在点元的位置、法向量和颜色信息。

在该过程中同步运行回环检测,并且基于结果优化整个地图。

[接下来作者强调了一下用ElasticFusion中储存三维信息方式的优越性] 基于变形图和点元的ElasticFusion表现方式让其自然而然地适应了这个任务,允许概率分布能够与点元一起在回环中”携带(carried along)”,同时融合了新的深度读数来更新点元的深度和法向量信息。这个过程不需要破坏点元或者其基于的概率分布。

 

B. CNN Architecture

接下来介绍该系统中应用的CNN模型。基于caffe,使用Deconvolutional Semantic Segmentation 网络架构,基于VGG 16-layer网络,但是额外配备了最大unpooling和deconvolutional的训练来输出稠密像素级语义概率地图的神经元。

它为RGB输入训练,在接下来我们称呼其为RGB-CNN。

由于深度信息是有效的,作为第四通道输入网络中训练。

我们将到来的图像缩放到基本的224x224分辨率,缩放过程中用双线性差值获得RGB,用最邻近获得深度。

 

C. Incremental Semantic Label Fusion

 感觉是全文重点。

  • 3
    点赞
  • 20
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值