视频运动放大一:欧拉视频放大,《Eulerian video magnification for revealing subtle changes in the world》

《Eulerian video magnification for revealing subtle changes in the world》(EVM)

目录

《Eulerian video magnification for revealing subtle changes in the world》(EVM)

背景

方法

实验

总结


背景

视频的时空处理相结合可以放大细微的变化,从而揭示周围世界的一些重要方面。如人类皮肤的颜色随血液循环而略有变化,细微表情和微小运动(脉搏,心率,桥梁变化等)等人类难以肉眼观测到的方面放大后,方便进行后续分析。

方法

如上图所示。EVM 是基于光流法并利用一阶泰勒展开来实现运动放大的一种经典方法。可以揭示和放大视频中的小动作和变化,EVM 首先将输入帧进行金字塔分解(空间分解),应用滤波于每个金字塔内的级别,而不是原始图片上的级别,因为目标是放大金字塔各个级别包含运动频率。然后,该技术将所需频率乘以放大系数α(由用户定义); EVM 放大实际运动并允许我们可以识别肉眼无法察觉的运动,所需的放大值频率被加回到相同级别的未放大的频率以获得最终视频夸张的动作。

下面分别解释上一自然段中黑色部分。


金字塔分解

金字塔分解,将图像应用高斯模糊核,将原图与模糊后的图像相减得到拉普拉斯金字塔。

即拉普拉斯金字塔是由高斯金字塔得来的,我们将原始图像通过与卷积核进行卷积以及隔行隔列的下采样(减小尺度),重复这一过程,我们就可以得到完整的高斯金字塔。

将高斯金字塔的最顶层隔行隔列且与同一卷积核卷积得到上采样图像,将同层的高斯金字塔与该上采样图像做差,得到与该层拉普拉斯金字塔,重复这一过程就得到全部的拉普拉斯金字塔。

如果我们用上采样图像与拉普拉斯金字塔对应层相加就会得到同层高斯金字塔,重复这一过程我们就能得到原始图像。(用于EVM最后的图像重建)


滤波

  欧拉视频放大采用标准视频序列作为输入,应用空间分解之后,然后对帧进行时域滤波。对特定信号放大之后,合成重构,得到结果。

  低通滤波:滤除高频成分保留低频成分的方法

  高通滤波:突出高频成分而使低频分量相对受到抑制的方法

  带通滤波:保留特定频段的波的同时屏蔽其他频段

如下为不同的滤波器

上图列举的有三种滤波器,理想带通滤波器、巴特沃斯滤波器、无限冲激响应滤波器。一般来讲对于颜色的放大,我们选择理想带通滤波器,而对于动作的放大我们考虑巴特沃斯滤波器或者无限冲激响应滤波器。这是因为颜色的变化比较静思,我们需要陡峭的截止频率,以防止颜色观察错误。而对于运动放大比较‘’粗放‘’,若选用的频域滤波器具有陡峭的变化,则会使滤波结果图像产生“振铃”现象,我们选用巴特沃斯滤波器或者无限冲激响应滤波器可以避免。

用I(x,t)表示图像在空间x处和在时间t处的强度,则有

其中δ (t)代表位移函数,即代表从0到t时刻x的变化。使用一阶泰勒级数展开,则得到如下分解式子,

 对I(x,t)使用带通滤波器进行滤波,δ (t)处于滤波的频带范围内,假设提取出了f(x)以外的所有信号,即B(x,t),如下


乘以放大系数α

 对上式子进行放大处理,即乘以放大因子α之后与原信号相加:

 联立上述式子,得到

 之后利用泰勒展开式可以得到输出信号

 上式子表明运动放大的整个过程,f(x)在时刻t的位移δ (t)被放大了(1+α)倍


加回

参考金字塔分解,重新看一下。


实验

我利用文章开源代码进行了实验,自行拍摄了一段脉搏变化的视频并进行放大,结果如下。无法上传视频好像,便截了关键图。

原始视频帧:

 放大后的脉搏:

总结

        由于基于光流思想的EVM算法采用修改运动区域像素值强度的方式实现运动信号的放大,当无法区分噪声信号和运动信号时,在放大信号的同时会一并将噪声放大,从而湮没运动信号,进而产生图像的伪影及运动信号的损坏,影响有效信息的提取。      

         EVM适合在高空间频率下使用较小的放大倍数,并且当放大倍数增加时会显著放大噪声。

本文为该运动放大系列下文章,系列目录如下:

运动放大、视频放大、Video Motion Magnification、Video Magnification_Alocus_的博客-CSDN博客目录背景方法拉格朗日法欧拉法线性欧拉方法非线性欧拉方法深度学习法总结挖坑,运动放大。如果关注的伙伴们多,我会尽快更新,才疏学浅,我会把我了解到的知识在本系列中写出来。背景人类肉眼难以观察到细微的变化,然而重要的信息往往潜藏在其中,视频放大技术能够让我们更好地观察到视频中的这些变化,并对其进行深入的分析和利用。方法主要分三大类,拉格朗日法、欧拉法(线性、非线性)、深度学习法拉格朗日法《Motion magnification》欧拉法https://blog.csdn.net/Crystal_remember/article/details/116781912

  • 11
    点赞
  • 36
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 15
    评论
机器学习是一种人工智能(AI)的子领域,致力于研究如何利用数据和算法让计算机系统具备学习能力,从而能够自动地完成特定任务或者改进自身性能。机器学习的核心思想是让计算机系统通过学习数据中的模式和规律来实现目标,而不需要显式地编程。 机器学习应用非常广泛,包括但不限于以下领域: 图像识别和计算机视觉: 机器学习在图像识别、目标检测、人脸识别、图像分割等方面有着广泛的应用。例如,通过深度学习技术,可以训练神经网络来识别图像中的对象、人脸或者场景,用于智能监控、自动驾驶、医学影像分析等领域。 自然语言处理: 机器学习在自然语言处理领域有着重要的应用,包括文本分类、情感分析、机器翻译、语音识别等。例如,通过深度学习模型,可以训练神经网络来理解和生成自然语言,用于智能客服、智能助手、机器翻译等场景。 推荐系统: 推荐系统利用机器学习算法分析用户的行为和偏好,为用户推荐个性化的产品或服务。例如,电商网站可以利用机器学习算法分析用户的购买历史和浏览行为,向用户推荐感兴趣的商品。 预测和预测分析: 机器学习可以用于预测未来事件的发生概率或者趋势。例如,金融领域可以利用机器学习算法进行股票价格预测、信用评分、欺诈检测等。 医疗诊断和生物信息学: 机器学习在医疗诊断、药物研发、基因组学等领域有着重要的应用。例如,可以利用机器学习算法分析医学影像数据进行疾病诊断,或者利用机器学习算法分析基因数据进行疾病风险预测。 智能交通和物联网: 机器学习可以应用于智能交通系统、智能城市管理和物联网等领域。例如,可以利用机器学习算法分析交通数据优化交通流量,或者利用机器学习算法分析传感器数据监测设备状态。 以上仅是机器学习应用的一部分,随着机器学习技术的不断发展和应用场景的不断拓展,机器学习在各个领域都有着重要的应用价值,并且正在改变我们的生活和工作方式。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 15
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Alocus_

如果我的内容帮助到你,打赏我吧

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值