一般数据集
KITTI使用小车采集数据,在translation和rotation只有两个方向。
仿真得到,各个方向可以分布均匀。
基本涵盖了常见传感器信息。
各种VSLAM算法在tartanAir的表现。
ORB失败的场景
用该数据训练了一个tartanVO模型。只计算两帧之间的位姿。
有两点1.尺度的问题
loss的位置部分用只考虑方向,来解决尺度问题。
2.不同相机的内参不同问题:
把训练图片resize(相当于改变焦距),裁剪(相当于改变cx,cy)
加入内参层。
这样训练的模型可以适应各种相机拍出来的图片。
结果:
ORB有全局优化,而tartanVO纯粹计算两帧之间的位姿,故有累计误差。
TartanVO可以适应各种公开数据集,以及作者自己随意采集的数据。
作者讲解视频