论文阅读 | AdaCoF: Adaptive Collaboration of Flows for Video Frame Interpolation

前言:CVPR2020一篇基于核的视频插帧文章
ps:代码已经公布,运行无压力,但是其中的adacof的部分写得太底层了读不大懂,就浅浅的从文章层面谈谈我的理解好了
论文地址:【here】
代码地址:【here】

AdaCoF: Adaptive Collaboration of Flows for Video Frame Interpolation

引言

文章开始抛出了一个自由度Degrees of Freedom (DoF).的概念,即目前的不管是基于流的方法也好和基于核的方法也好,自由度都是受限的。
(一开始我特别迷惑这个自由度是啥)
文章给的自由度的解释如下这幅图
在这里插入图片描述
当然一开始我也看不明白这是啥意思,结合了后文的描述我的大致理解如下
图a基于核的方法,即用卷积核覆盖大部分的位移区域,然后算对应位置的位移
图b基于流的方法,位置随着流估计到达中间的某一个点
图c结合流和核的方法,在基于核的基础上,加上一个整体的偏移(类似光流),因此不用覆盖那么大的面积
图d的方法基于核的方法基础上,加上每个像素自适应的对应偏移(类似光流),因此有更多的自由度

网络架构

不加偏移的核的学习可以看成这个公式(图a)
在这里插入图片描述
每个像素加一个整体偏移(α、β)的核的学习为(图c)
在这里插入图片描述
每个像素加一个像素级偏移(α、β)的核的学习为(图d)
在这里插入图片描述
同时加上一个膨胀系数(Dilation)
在这里插入图片描述
由于没看懂代码怎么实现,我猜是用膨胀卷积做最后的核的卷积吧

网络架构
在这里插入图片描述
学习核的网络还是挺常规的

损失函数
这里作者提出了一种对抗式新型损失函数
在这里插入图片描述

实验

对比实验
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
可以看到生成的结果有较少的运动模糊和伪影

作者还做了一些关于损失函数、核大小的选择、膨胀系数选择的消融实验
同时做了对生成的各种参数的可视化
在这里插入图片描述
比如遮挡区域,更多是来自边缘,运动边缘通常只能其中一幅图提供图案的纹理信息,比如树叶离开的区域是来自红色部分,树叶到来区域来自蓝色部分,
流平均和光流可以类似比较
流方差作者在这里衡量的是像素偏移的分散程度

总结

这里作者提出了一个自由度的概念,感觉相比与其他插帧文章比较陌生,其实就是整体的偏移改成了像素级偏移,代码写的我也看不懂,还有很多需要琢磨的地方

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值