Review Article Review of Stereo Matching Algorithms Based on Deep Learning

基于深度学习的立体匹配算法综述(没看完)

(1)非端到端(2)端到端(3)无监督

非端到端

限制:每个深度值下计算成本问题,有限的感受野无法推断出错误点,后续步骤还是依靠经验手动设置参数。

端到端:可生成高精度深度估计,但是在无纹理、详细结构的小物体和近边界处很难找到正确对应点。而且需要更大的存储器和相对费时,对应的地面真值训练和大量标记工作。

Kitti数据集是怎么来的,安装在车顶部的相机拍的,还有旋转激光扫描仪,测量地面真值,数据集包含真实的视差值可以用于训练,也可以给出精确度用来预测。评估指标通常是端点误差(EPE),即像素的平均平 均视差误差。对于KITTI 2012,报告了 ⾮遮挡(Non-occ)和所有(All)像素 的错误像素百分⽐和平均端点错误。对 于KITTI2015,将针对背景,前景和所 有像素评估视差离群值D1的百分⽐。 离群值定义为视差误差⼤于max (3px,0.05d *)的像素,其中d *表示 地⾯真实视差。

非端到端:原始的太费时间,需要67秒,快速结构只要0.7秒。一个是cnn完了连接到DNN,一个是在代价计算中融入了多尺度特征,cnn完了之后直接点积。Luo提出

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
基于无迹二重四元数滤波的立体视觉SLAM 立体视觉SLAM是一种通过使用多个相机来同时感知环境并计算相机位姿和地图的技术。其中,无迹二重四元数滤波是一种用于姿态估计的滤波方法。 无迹二重四元数滤波是一种扩展了基于四元数的卡尔曼滤波的方法,用于在立体视觉SLAM中对相机的位姿进行估计。它通过将姿态表示为一个实部和一个虚部四元数来进行计算。其中实部表示旋转的主轴,并且虚部表示旋转的偏差。这种扩展的滤波方法可以同时估计旋转和平移分量,对于立体视觉SLAM中的运动估计非常有用。 在使用无迹二重四元数滤波进行立体视觉SLAM时,我们基于视觉传感器获取的立体图像来提取特征点,并使用这些特征点来计算相机的运动。然后,通过使用无迹二重四元数滤波来对相机的位姿进行估计,并递推地构建地图。这个过程根据特征点间的匹配和相机的移动来估计相机的轨迹,并同时估计地图的三维结构。 无迹二重四元数滤波在立体视觉SLAM中有着许多优点。首先,它能够同时估计相机的旋转和平移,提高了位姿的准确性。其次,它能够通过使用四元数来表示姿态,减少了计算量。最后, 通过对滤波器进行适当的观测噪声建模和状态转移噪声建模,可以提高系统的鲁棒性和稳定性。 总而言之,基于无迹二重四元数滤波的立体视觉SLAM可以准确估计相机的位姿和三维地图,并在许多应用领域中有着广泛的应用。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值