本文提出了一种能够将光流估计问题作为监督学习任务的CNNs。我们提出并比较两个架构:一个通用架构和另一个架构,包括一个在不同的图像位置关联特征向量的层。由于现有的地ground truth数据集不够大,不足以训练CNN,所以我们生成了一个大型的合成Flying Chairs dataset。我们发现,在这种不现实的数据上训练的网络,仍然可以很好地推广到现有的数据集,比如Sintel和KITTI,在5到10 fps的帧率上达到了有竞争的精度。
翻译:https://blog.csdn.net/weixin_42164269/article/details/80613782
FLOWNET2.0
https://www.cnblogs.com/jiujing23333/p/9386695.html
FlowNet 2.0: Evolution of Optical Flow Estimation with Deep Networks
训练数据集的调度对于模型的性能有较大的影响。光流的数据集都比较小,一般需要几个数据集一起train,故如何使用这些数据集是至关重要的。
使用中间光流warp图片,并以此作为一个监督信号辅助训练。
用一个子网络处理小位移。