摘要
- 也是基于patches的匹配
- 加入亮度信息
- 最后基于全局优化
可惜没有公开代码,在KITTI2012数据集上排在16,没有在2015上排。
1 Introduction
This deep embedding model leverages appearance data to learn visual dissimilarity between image patches, by explicitly mapping raw intensity into a rich embedding space.
与mc-cnn相似,不同点在于:
(1)对左右两个patches得到的输出(feature vectors)我么直接通过点乘计算其欧拉空间距离,而mc-cnn则更为复杂,需要采用fc来得到最终的相似性score,相比之下我么的框架更加快、
(2)本框架是一个多尺度网络,可以学习不同尺度空间的特征向量。
在feature matching领域,应用cnn的有[12,22],其中[12]是稀疏的,而[22]是主要真毒匹配semantically similar regions。
2 deep embedding for stereo estimation
2.1 Multi-scale Deep Embedding Model
左图的patch IL(p) 右图的IR(p-d):
patch size =13 * 13,正样本的内积大而负样本的内积小,这一点与mc-cnn额的