基于深度学习的立体匹配算法综述(没看完)
(1)非端到端(2)端到端(3)无监督
非端到端
限制:每个深度值下计算成本问题,有限的感受野无法推断出错误点,后续步骤还是依靠经验手动设置参数。
端到端:可生成高精度深度估计,但是在无纹理、详细结构的小物体和近边界处很难找到正确对应点。而且需要更大的存储器和相对费时,对应的地面真值训练和大量标记工作。
Kitti数据集是怎么来的,安装在车顶部的相机拍的,还有旋转激光扫描仪,测量地面真值,数据集包含真实的视差值可以用于训练,也可以给出精确度用来预测。评估指标通常是端点误差(EPE),即像素的平均平 均视差误差。对于KITTI 2012,报告了 ⾮遮挡(Non-occ)和所有(All)像素 的错误像素百分⽐和平均端点错误。对 于KITTI2015,将针对背景,前景和所 有像素评估视差离群值D1的百分⽐。 离群值定义为视差误差⼤于max (3px,0.05d *)的像素,其中d *表示 地⾯真实视差。
非端到端:原始的太费时间,需要67秒,快速结构只要0.7秒。一个是cnn完了连接到DNN,一个是在代价计算中融入了多尺度特征,cnn完了之后直接点积。Luo提出