问题思考
在看深度估计的无监督学习方法时,看到有作者提出立体视觉匹配本身是个不适定问题,所以基于立体视觉匹配的无监督学习方法和有监督比性能上还是有差距。
为什么是不适定问题(ill-posed problem)
论文《Stereo Matching Using Belief Propagation》中提到了stereo vision matching中存在的相关问题。
- Noise(噪声):在形成一张图像时,光线的变化是不可避免的,同时还有图像的模糊,传感器的噪声等。
- Textureless region(低纹理区域):低纹理区域无法运用强度一致性约束,因此高纹理处的信息需要转化成用于立体匹配的低纹理区域(这一块儿没大懂)
- Depth discontinuties(深度的不连续):空间顺滑约束在物体的边界处就会失效,简而言之,信息的迭代将会止步于深度不连续处。
- Occlusion (遮挡区域):一张图片的部分区域被遮挡,而另外一张未遮挡,无法通过单张图片得到这块区域的深度信息。
综上所述,立体视觉匹配是一个不适定的问题
[参考文献]
(http://www.jiansun.org/papers/Stereo_PAMI.pdf)