深度学习方法在解决光流估计问题方面取得了巨大的成功。成功的关键在于使用cost volume和从粗到精的flow推断。但是,当图像中存在部分被遮挡或同质的区域时,匹配问题就变得ill-posed。这将导致cost volume包含异常值,并影响从其进行的流解码。此外,从粗到细的流推断还需要精确的流初始化。歧义对应会产生错误的流场,并影响后续级别中的流推断。
LiteFlowNet3,这是一个由两个专用模块组成的深度网络,可以应对上述挑战。
(1)我们通过在流解码之前通过自适应调制修改每个成本向量来改善cost volume中的异常值问题。
(2)通过探索局部流动的一致性进一步提高流动精度。为此,通过新颖的flow弯曲,从附近位置用精确的光流代替了每个不准确的光流。
https://github.com/twhui/LiteFlowNet3
tensorflow平台:
有预训练:第一个40m caffemodel
www.dropbox.com/
Download the model