【论文阅读】Iterative Residual Refifinement for Joint Optical Flow and Occlusion Estimation

目的:原来的一些比较好的方法,不论是FlowNet2还是PWCNet,网络所消耗的算力都不小。FlowNet2需要级联encoder-decoder结构以达到SOTA;而PWCNet使用了feature pyramid使得网络轻量,但在不同分辨率解码光流时都需要使用不同的Denset block,参数量也不少。而这篇文章提出IRR方法,使得模型参数量大大减少,主要原因在于IRR这种训练方法使得每一个model unit或是block uint的复用率大大增加。
 

方法

IRR从经典的能量最小化方法和残差网络中汲取灵感,提出一种基于权重共享的迭代残差细化方法,IRR可以与多个主干网络结合。减少了参数量的同时,提高了准确性。集成了遮挡预测和双向流估计后,IRR可以进一步提升性能。

FlowNet的IRR版本就是迭代地重复使用FlowNetS,利用网络预测的光流去warp图像2,然后与图像1一起再次输入同一个FlowNetS,这样不断地refine这个网络。PWC-Net的IRR版本的主要改动在optical flow decoder部分,原始的PWC-Net会在每个分辨率使用一个decoder去预测光流,但是IRR版本的PWC-Net复用同一个decoder去预测不同分辨率的光流。

IRR with FlowNet

FlowNet的IRR版本就是迭代地重复使用FlowNetS,利用网络预测的光流去warp图像2,然后与图像1一起再次输入同一个FlowNetS,这样不断地refine这个网络。具体的公式表示如下:

看下面这个图就更清楚了---图(a)中是两个不同的encoder-decoder,而图(c)中是同一个encoder-decoder。

IRR with PWC-Net

PWC-Net的IRR版本的主要改动在optical flow decoder那部分,原始的PWC-Net会在每一个分辨率使用一个decoder去预测光流,但是IRR版本的PWC-Net就复用一个decoder去预测不同分辨率的光流,这个地方着实有点巧妙。具体公式表示如下:

其中

较小分辨率的光流预测结果经过upsample就可以用来warp较高分辨率的feature map,从而构建cost volume,连同图像1的feature map还有经过上采样的光流就可以被用来预测较高分辨率的光流残差。如下图所示:

参考:IRR论文笔记 - 知乎

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值