【论文速览】引入motion guidance用于模糊分解/模糊插帧

我是大黄同学呀

已于 2023-03-30 17:26:45 修改

阅读量527

点赞数

分类专栏：读点论文 - 论文速览读点论文 - 视频处理文章标签：计算机视觉人工智能模糊分解

于 2023-03-20 12:55:05 首次发布

本文链接：https://blog.csdn.net/qq_36560894/article/details/129665071

版权

读点论文 - 论文速览同时被 2 个专栏收录

4 篇文章

订阅专栏

读点论文 - 视频处理

2 篇文章

订阅专栏

文章目录

收录于 ECCV 2020，代码地址：https://github.com/zzh-tech/Animation-from-Blur

研究背景

传统的图像模糊问题主要解决的是1对1的映射，即输入一张模糊图像，输出对应的一张清晰图像。但这种方式忽略了模糊中蕴含的有效时序信息，比如运动模糊可以理解为在相机曝光的短时刻内所录制的场景发生的平均变化情况。因此最近的工作开始注意到一个更具挑战性的问题，即通过单张运动模糊图片得到一组清晰的图像序列(短视频)，这相当于运动模糊形成的逆过程，这个问题也称为模糊分解问题(blur decomposition)或者模糊插帧(blur interpolation)。
在这里插入图片描述
作者针对“模糊分解”问题进行分析，发现对于每个模糊区域（例如下图中的左手右手、左脚右脚等）都可以存在"前向运动"和"后向运动"两种可能的解(forward 或 backward motion)，随着图像中运动模糊区域的增加，潜在的解的数量将会呈指数型增长，这就是运动歧义性问题(motion ambiguity)。
在这里插入图片描述
而目前的方法都没有考虑到运动歧义性(motion ambiguity)，这会导致模型只是在预测众多方案中的一个解，给训练过程带来了不稳定性。如果不解决这种问题，会导致模型多样化程度低以及生成质量较差。

解决思路

为了解决歧义性的问题，作者引入运动指导表征(motion guidance)，它是2D光流在四个方向上的粗略量化表示（只有方向没有幅值），如下图所示(不同颜色代表不同运动方向)。有了motion guidance后就变成了一对一的映射问题，模型就能生成一个特定方向、无歧义性的图像序列解。

在这里插入图片描述
作者进一步提出了一个两阶段的模糊分解网络，如下图所示。第一阶段通过输入模糊图像与运动引导，生成初步的图像序列，第二阶段通过残差的方式进一步细化视觉细节。

在这里插入图片描述
模型的训练与推理阶段都需要用到motion guidance，作者提出了三种不同的方式用于生成模糊图像对应的motion guidance。第一种方式通过cVAE-GAN网络去学习模糊图像对应的motion guidance分布，这可以在推理时通过采样得到不同的motion guidance来生成不同的解；第二种方式就是如果输入的是一个模糊视频序列，那么可以直接进行光流估计，进行量化就可以得到motion guidance；第三种方式就是通过用户自己绘制一个大概的motion guidance用于分解。
在这里插入图片描述