图像算法可以稳定处理视频了!港科大开源通用算法,解决视频处理时域不稳定问题|NeurIPS 2020...

本文转载自极市平台。

作者丨雷晨阳、邢亚洲

编辑丨极市平台

导读:许多图像处理算法虽在单个图像处理中表现出色,但将其直接用于视频时往往会遇到时域不一致问题。本文提出一种通用的框架,可将图像处理算法转换为对应的具有高度时域一致性的视频处理算法,以解决上述问题。

arXiv链接:

https://arxiv.org/abs/2010.11838
project主页:

https://chenyanglei.github.io/DVP/index.html

代码地址:

https://github.com/ChenyangLEI/deep-video-prior

video:

许多图像处理算法已在单个图像处理任务中表现了出色的性能,但是将它们直接应用于视频上通常会有时域不一致问题(例如闪烁问题),如图1所示。为了提高时域一致性,大多数研究人员针对不同的视频处理任务设计了专用算法,例如视频上色,视频去噪和视频超分辨率。尽管特定任务的视频处理算法可以改善时域一致性,但是能否将类似的策略应用于其他任务尚不清楚或具有挑战性。不同于前者,作者提出了一种新颖且通用的框架,该框架可以将图像处理算法转换为对应的具有高度时域一致性的视频处理算法。

输入视频帧应用图像上色算法的预处理视频

图1. 将图像算法应用上视频上

作者观察到一种称作深度视频先验(Deep Video Prior, DVP)的现象:利用视频帧来训练卷积网络的过程中,视频不同帧之间的对应图像块的网络预测输出倾向于一致。 此外,作者认为,视频中的闪烁现象类似于时域中的”噪声“,可以通过该深度视频先验来进行校正。具体而言,在尝试拟合带有闪烁问题的预处理视频时,网络会首先拟合视频中的共同特征,最后才会拟合到不稳定的闪烁噪声。

预处理视频算法输出

图2. 利用作者算法处理一个不稳定的预处理视频

图3. 算法框架对比

将输入视频帧 通过应用图像处理算法f可获得相应的预处理帧 。例如,图像处理算法f可以是图像着色,图像去雾或任何其他算法。该框架通过输入视频和预处理视频来获得具有时域一致性的输出视频,如图2所示。该算法整体框架如图3所示,作者使用一个全卷积网络g模仿原始图像算法f,同时保持时域一致性。与前人工作(Lai et al.) 不同,训练仅需单个视频,并且仅使用单个帧进行每次训练迭代。作者对网络进行进行随机初始化,然后可以在每次网络优化迭代中使用单个数据项对其进行优化,而无需进行任何显式正则化(如光流等)。如图2所示,视频的时域稳定性得到了较大提升。

图4.  两种时域不稳定现象

作者发现许多时域不一致问题属于单模态不一致:所有预处理帧接近于同一模式但是相互之间略有不一致。然而,对于某些任务,存在单一输入具有多种可能预测结果(例如,在上色算法中,汽车可能会被着色为红色或蓝色)。在这种情况下,如图4右图所示,预处理视频中的时间不一致在视觉上更加明显。由于多个模态之间的差异可能很大,因此对不同模式进行平均会导致较差的性能,这与任何一种可能的输出都相去甚远。以前的方法无法生成一致的结果[19]或倾向于大大降低原始性能[3]。

作者提出了一种迭代加权训练(IRT)策略来处理多模态时域不一致的问题,因为它无法被基本的深度视频先验(DVP)来解决。在IRT中,置信度旨在为每个像素从多种模式中选择一种主模式,而忽略离群值(一种次要模式或多种模式)。作者通过增加网络输出中的通道数量(例如,两个RGB图像为六个通道)以获得两个输出:一个主帧; 和一个离群帧。最终我们通过置信图来选择不同的像素用以训练两个不同的帧。

作者首先通过实验中的7个任务评估框架,包括视频上色、视频去雾、视频增强、视频白平衡等等。作者利用两个指标分别评估视频稳定性和效果退化问题并且在两个指标上都超过了盲视频时域一致性领域内最好的算法。作者也进行了一个user study,在大多数任务上作者的结果最受喜爱。

图5. 算法效果对比示例

如图5所示,在上色和白平衡的任务中,作者的算法得到了时域一致性的结果,同时最大程度上保留图像算法的效果。

图6. IRT的影响

如图6所示,通过使用IRT策略,在面临多模态不一致问题时,作者算法依旧可以得到时域稳定的效果。

图7. 不同网络结构的影响

如图7所示,作者验证了深度视频先验(DVP)在多种网络结构上都是有效的。

总结

作者提出了一种简单而通用的方法来提高经图像算法处理的预处理视频时的时域一致性。基于作者观察到的深度视频先验(DVP),作者通过利用单个视频从头训练CNN来实现时域一致性。与以前的工作相比,作者的方法要简单得多,并且可以产生令人满意的结果(更好的时域一致性以及更大程度保留原始算法效果)。作者的迭代加权训练(IRT)策略还很好地解决了具有挑战性的多模态不一致问题。作者认为,所提出的方法的简单性和有效性可以将图像处理算法转化成其对应的视频处理算法。因此,利用该框架,人们可以将最新的图像处理算法直接应用于视频。

作者方法的局限性之一是相对较长的测试时间。尽管作者的方法不需要训练大型数据集,但需要为每个视频训练一个单独的模型,与Lai等人相比,比直接推理要花费更多的时间。但是,与以前采用显式采用光流来增强时域一致性的方法不同,作者证明了这一点,通过神经网络训练可以隐式地实现视频先验(即时域一致性)。

作者表示,他们将专注于提高效率以缩短实际应用中的处理时间。此外,作者相信DVP的概念可以进一步扩展到其他类型的数据,例如3D数据和多视图图像。DVP不依赖于视频帧的顺序,并且自然应适用于维护多个图像之间的多视图一致性。对于3D volume数据,3D CNN也可能表现出DVP的相似属性。

作者介绍

雷晨阳,香港科技大学三年级博士生,博士导师陈启峰,本科毕业于浙江大学,主要研究领域:计算摄影学,图像处理和视频处理,low-level computer vision,3D vision。

邢亚洲,香港科技大学三年级博士生,博士导师陈启峰,本科毕业于武汉大学,主要研究领域:计算摄影学,图像增强,low-level computer vision。

END

备注:视频

视频处理交流群

扫码备注方向拉你入群。

我爱计算机视觉

微信号:aicvml

QQ群:805388940

微博知乎:@我爱计算机视觉

投稿:amos@52cv.net

网站:www.52cv.net

在看,让更多人看到  

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 《数字信号处理理论算法与实现(胡广书)》是一本介绍数字信号处理理论与算法的经典著作。以下是该书的部分matlab代码示例及参考文献。 1. 频域滤波: 在第4章中介绍了频域滤波的理论与算法,其中频域滤波的一种实现是使用快速傅里叶变换(FFT)进行频谱分析和滤波操作。以下是一个简单的matlab代码示例,用于对一个音频信号进行频域滤波。 ```matlab % 输入音频信号 [x, Fs] = audioread('input.wav'); % 使用FFT进行频域分析 X = fft(x); % 设计一个低通滤波器 N = length(X); H = zeros(1, N); cutoff_freq = 1000; H(1:cutoff_freq) = 1; % 对频谱进行滤波 Y = X .* H; % 使用IFFT将滤波后的频谱转换回时域 y = ifft(Y); % 播放输出音频信号 sound(y, Fs); ``` 参考文献: 胡广书. 数字信号处理理论算法与实现. 电子工业出版社, 2015. 2. 时域滤波: 在第5章中介绍了时域滤波的理论与算法,其中时域滤波的一种实现是使用卷积操作。以下是一个简单的matlab代码示例,用于对一个音频信号进行时域滤波。 ```matlab % 输入音频信号 [x, Fs] = audioread('input.wav'); % 设计一个低通滤波器 cutoff_freq = 1000; h = fir1(100, cutoff_freq/(Fs/2)); % 对音频信号进行卷积滤波 y = conv(x, h); % 播放输出音频信号 sound(y, Fs); ``` 参考文献: 胡广书. 数字信号处理理论算法与实现. 电子工业出版社, 2015. 以上是《数字信号处理理论算法与实现(胡广书)》中两个简单的matlab代码示例及相关参考文献。该书还涵盖了更多数字信号处理算法的实现,读者可以参考该书以获得更详细的代码和理论解释。 ### 回答2: 《数字信号处理理论算法与实现(胡广书)》是一本重要的数字信号处理教材,其中涵盖了数字信号处理的理论知识和算法实现。在书中介绍了多种数字信号处理算法和其在MATLAB中的实现。 下面是该书中提供的一种具体算法实现的MATLAB代码示例: % 例2-1 简单的FIR低通滤波器设计 Fs = 8000; % 采样频率 N = 64; % 滤波器阶数 Fc = 1000; % 通带截止频率 Wn = 2*Fc/Fs; % 归一化截止频率 b = fir1(N, Wn, 'low'); % fir1函数生成FIR低通滤波器的系数 freqz(b,1,1024, Fs); % freqz函数绘制滤波器的幅频响应 该代码实现了一个简单的FIR低通滤波器的设计,使用了MATLAB中的fir1函数生成了滤波器的系数,并使用freqz函数绘制了滤波器的幅频响应。代码中的参数可以根据需要进行调整,如采样频率Fs、滤波器阶数N和通带截止频率Fc等。 关于数字信号处理理论和算法的更多实现代码,可以参考该书中的其他章节和附录部分。此外,也可以参考其他数字信号处理相关的教材和学术论文,如《数字信号处理》(张学工)、《MATLAB数字信号处理》(李雅芳)等,这些教材中也提供了丰富的MATLAB代码和实验示例供参考。 参考文献: 1. 胡广书. 数字信号处理理论算法与实现. 清华大学出版社, 2019. 2. 张学工. 数字信号处理[M]. 清华大学出版社, 2012. 3. 李雅芳. MATLAB数字信号处理[M]. 清华大学出版社, 2015.

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值