《论文阅读》CNN for IMU Assisted Odometry Estimation using Velodyne LiDAR

最新推荐文章于 2024-07-09 00:04:06 发布

未知丶丶

最新推荐文章于 2024-07-09 00:04:06 发布

阅读量419

点赞数 1

分类专栏：深度学习计算机视觉文章标签：计算机视觉人工智能

本文链接：https://blog.csdn.net/qq_43310834/article/details/118576287

版权

深度学习同时被 2 个专栏收录

107 篇文章 14 订阅

订阅专栏

计算机视觉

91 篇文章 10 订阅

订阅专栏

留个笔记自用

CNN for IMU Assisted Odometry Estimation using Velodyne LiDAR

做什么

Lidar Odometry激光雷达里程计，里程计作为移动机器人相对定位的有效传感器，为机器人提供了实时的位姿信息。移动机器人里程计模型决定于移动机器人结构和运动方式，即移动机器人运动学模型。
简单来说，里程计是一种利用从移动传感器获得的数据来估计物体位置随时间的变化而改变的方法
在这里插入图片描述
用建图的方式来理解，要实现机器人的定位与导航，就需要知道机器人走了多远，往哪走，也就是初始位姿和终点位姿，只有知道了里程计，才能准确将机器人扫描出来的数据进行构建。

做了什么

在这里插入图片描述
将3D稀疏点云投影至2D后用CNN解决问题，这里还为激光雷达里程计任务提出了一种alternative networks（替代网络）

怎么做

在这里插入图片描述
激光雷达里程计的任务目标是输入给定当前帧点云P_n和前N帧P_n-1，P_n-2…P_n-N，每帧点云存在不同数量的点，每个点的组成为

p^x、p^y、p^z是点p的三维坐标，pⁱ是点p的深度值，p^r捕获该点时的“环指数”，这个在后面有提及
希望得到一个6DoF（6自由度，三个方向的平移和沿三个轴的旋转）的位姿转换T_n
在这里插入图片描述
用一个参数θ来表示这个映射函数

也就是将N+1长度的序列点云通过网络结构代表的函数θ得到目标6DoF转换矩阵T_n
首先也是点云领域的常客，输入点云的数据处理，这里也采用的3D至2D的柱面投影方式，设投影函数为ε，这样就可以改写任务目标为
在这里插入图片描述
也就是输入为点云投影的2D密集矩阵M，通过这个平面序列得到目标的6DoF结果，不过为了更精细地区分6DoF中的两个（旋转和平移），这里是将它们俩分开来进行回归的，也就是存在θ_R和θ_t分别对应两个不同的映射
在这里插入图片描述
除此之外，还对旋转的映射R做了一点改进，因为KITTI数据集中的旋转都非常的小，与其设计成回归问题，这里是将其改进成了分类问题（密集采样），具体方法在后面介绍
然后就是具体定义这里的ε函数方式，这里的方法与以往的不同，采用了一个叫polar bin的东西（这里的polar是极坐标的意思）
在这里插入图片描述
这里的意思是将点云按照新设计的两维分割成多个部分，这里的两维r，c分别是ring index和polar cone

简单来说的意思就是将整个点云的每个点二维坐标（r，c）化，r是点的角度，c是点的线束
做法是用的之前的一篇论文《Collar line segments for fast odometry estimation from velodyne point clouds》
在这里插入图片描述
这里的b_r,c的意思是某一点云P中的某一个polar bin，ε与上面的整体函数不同，这里的ε是对这个polar bin内的所有点进行计算，p^x,y,z,i的定义方法与上面相同，|b_r,c|则是这个polar bin的大小。这两个式子的含义就是将这个polar bin点云内的所有点聚合转换成一个三维向量
这个三维向量就是作为矩阵M上索引（r，c）这个点上的三维特征，为了更好的拟合处理，将三维特征分在三个通道上，做成类似RGB图片的形式
在这里插入图片描述
总的来说，这里对输入的处理是将输入点云根据线束和角度分成多个polar bin，在每个小区域内聚合计算出一个三维向量代表这个区域，然后用二维方式表示一个个向量，通道方式表示每个索引坐标的三维向量
最终得到的就是最初的ε函数的目的，将点云投影成一个二维平面∈R^360×64×3
然后就是网络具体结构了
在这里插入图片描述
网络结构很明显，输入是一个图像序列，两个不同函数θ_r和θ_t都使用相同的CNN结构（成对输入），就是上面的CNN part，然后通过一个不同的FC层来进行最终两个结果的输出，也算是一个孪生网络
上面的CNN part结构为
在这里插入图片描述
这样就能使用这个网络进行平移量的回归，但就像前面说的对旋转的回归进行了一点改进，将其模拟成了分类问题，回顾一下设计公式

将网络修改成

简单来说就是在旋转空间中根据上一个旋转向量分维的密集采样了K个旋转向量，将这K个旋转向量应用到M_n帧上，然后利用CNN成对输入再用FC进行特征处理，最后softmax取所有旋转矩阵也就是R_i的可能性，变成了一个采样矩阵然后分类矩阵概率的网络，就像是评分网络一样
这里的CNN part是
在这里插入图片描述
值得注意的是，这里是三个孪生网络，分别构造了三个相同的网络来单独进行x、y、z三个轴的估计，也就是采样也是根据单个轴来进行±1°的采样

然后在采样的概率（评分）下选择最合适的旋转矩阵，可以采用softmax直接选，也可以像上面这样用加权平均的方法

总结

1.这篇主要是编码方式比较有特色，后面的网络结构没有什么特殊的地方，看来LO这个领域主要的就是处理输入数据，在这方面值得投入更多的研究空间
2.采用的孪生网络的方式进行独立的旋转和平移计算，但其实在我印象中之前不很多做法是共享特征的，反而效果更好，这也未尝不是种方法

未知丶丶

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
3
评论
《论文阅读》CNN for IMU Assisted Odometry Estimation using Velodyne LiDAR

留个笔记自用CNN for IMU Assisted Odometry Estimation using Velodyne LiDAR做什么Lidar Odometry激光雷达里程计，里程计作为移动机器人相对定位的有效传感器，为机器人提供了实时的位姿信息。移动机器人里程计模型决定于移动机器人结构和运动方式，即移动机器人运动学模型。简单来说，里程计是一种利用从移动传感器获得的数据来估计物体位置随时间的变化而改变的方法用建图的方式来理解，要实现机器人的定位与导航，就需要知道机器人走了多远，往哪走，也
复制链接

扫一扫

专栏目录