《Optical Flow in the Dark》光流

 光流其实就是目标物在第n帧与第n+1帧之间的位移差,也就是帧与帧的像素点的2维向量差。

在稠密光流图中,利用颜色表示目标光流向量的方向和强度

 《Optical Flow in the Dark》是2020CVPR ,文章最最最主要的就是提出了一个较牛逼的数据集FCDN ,利用该数据集训练现存的光流估计网络(这个网络不是作者自己提的,而是引用的),会取得很不错的效果。

        本文主要是想改善暗光下的光流估计效果,现存方法主要是将暗光下的图像进行提亮,再估计光流。但作者认为这样效果不好,因为提亮时候会破坏帧与帧之间的运动信息。

(1) 首先估计暗光下的噪声特性;

(2) 将噪声特性加入到FlyingChairs Dataset;

(3) 利用FlyingChairs Dark Noise(FCDN)训练FlowNet 、PWC-Net;

(4) 最后在Various Brightness Optical Flow(VBOF)上测试,发现预测暗光下的光流效果不错。

根据fig 1 ,就是 e,f,g 利用pwc-net估计光流,e是利用作者提出的FCDN数据集进行pwc-net的训练,然后再对b进行光流估计;

f是直接用pwc-net对b进行光流估计的;

g是在b增强的基础上,然后再估计的。

(其实就是两个光流估计主干:1)直接对图像进行光流估计;2)对图像增强提亮后,再光流估计)

Various Brightness Optical Flow Dataset (VBOF) 是作者自己拍的不同曝光下的图片,是用来测试并且估计噪声模型中的参数的。

Sony A6000 (102images), Canon EOS M6 (297 images), Fujifilm XT2 (199 images)

        在移动物体前后的大约10种不同的曝光中拍摄了原始图像,然后使用明亮清晰的图像对,用  FlowNet2.0计算光流,当作ground truth ,并且不同的曝光图像对共享相同的光流。

下图fig2 就是作者拍摄的数据集。

 End-to-end Optical Flow

在这个模块,依旧展示了光流估计的2个主干。Amplification ration 也相当于一个伽马,白平衡的操作。

 Noise Analysis

接下来到了噪声分析:解释:

噪声主要分为两种:高斯噪声、散粒噪声,其中,高斯噪声是与光强没有关系的噪声,无论像素值是多少。另一种是散粒噪声,因为其符合泊松分布,又称为泊松噪声,随着光强增大,平均噪声也增大。

引用了该偏文章的噪声模型

[1]Alessandro Foi, Mejdi Trimeche, Vladimir Katkovnik, and Karen Egiazarian. Practical poissonian-gaussian noise modeling and fitting for single-image raw-data. IEEE Transactions on Image Processing, 17(10):1737–1754, 2008. 4 《针对单图像原始数据的泊松-高斯噪声建模和拟合》

证明,真实噪声z(x)分布约等于正态分布,(μ=y(x), lambda^2 = ax + b)

a 和 b 就相当于泊松分布的斜率和偏执

 

    噪声水平通常随着亮度的下降而上升,在低强度暗图像中,a和b耦合更紧密,泊松相关参数比高斯相关参数相对较大,这意味着噪声更依赖于信号。 

 最后是FCDN数据集的合成步骤

 

 

 

 

这里有一个问题是,上图的数字是怎么来的,是predict和ground truth向量的2范数计算吗??     

Loss的设计:如果给定每个像素ground truth的光流,那么对于每个像素,loss可以定义为预测的光流(2维向量)和groundtruth之间的欧式距离,称这种误差为EPE(End-Point-Error)。

在这里也引入了NLM(非局部均值滤波)进行去噪,间接证明作者合成数据集的噪声是较为真实的。后面也是一些展示实验。

 

 

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: bounding box是指在图像中定位物体或区域的矩形框。而光流是指描述图像中像素在不同时间或帧之间的运动向量。 将bounding box作为optical flow输入可以通过以下步骤实现: 首先,根据任务的需求,在图像中选择目标物体或区域,并用bounding box进行标注。 然后,利用计算机视觉算法,例如基于深度学习的目标检测算法,对图像中的目标进行检测和定位。该算法将输入图像和bounding box作为输入,并输出目标检测结果。 接下来,对于每一帧图像中的bounding box,利用光流算法计算目标区域的运动向量。光流算法能够分析相邻帧之间的像素变化,并计算出物体在图像中的运动情况。 最后,根据光流算法计算出的运动向量,可以进一步分析目标物体的运动轨迹、速度和加速度等运动信息。这些信息可以应用于许多计算机视觉任务,例如运动跟踪、行为分析和视频压缩等。 通过将bounding box作为optical flow光流输入,可以更加准确地分析目标物体的运动情况,并为后续的任务提供更丰富的信息。这种方法在许多视觉任务中具有广泛的应用,例如视频监控、自动驾驶和虚拟现实等领域。 ### 回答2: bounding box(边界框)在计算机视觉领域中常用于表示物体在图像中的位置和范围。而optical flow光流)是一种用于估计图像中像素运动的技术。 将bounding box作为optical flow的输入意味着我们希望通过光流来估计给定物体在图像中的运动。通过监测bounding box的运动,我们可以了解物体的位移、速度和方向等运动信息。 在这种方法中,首先需要使用目标检测算法或手工标注的方式得到bounding box的位置。然后,我们可以使用光流算法对bounding box中的像素进行跟踪和分析,以获取物体的运动信息。 使用bounding box作为optical flow输入的好处是,只需对感兴趣的区域进行光流计算,减少了计算量,提高了计算效率。而且,通过对物体运动的分析,我们可以获得更精确的物体运动信息,有助于在视觉跟踪和行为分析等领域中的应用。 然而,bounding box作为optical flow输入也存在一些挑战和限制。首先,bounding box的准确性对光流的计算结果有很大的影响,如果bounding box的位置不准确,可能会导致光流计算出的运动结果不准确。此外,如果物体发生较大的旋转、遮挡或形变等情况,bounding box的边界可能无法完整地包围物体,从而影响光流的计算和分析结果。 综上所述,bounding box作为optical flow光流的输入可以用来估计给定物体在图像中的运动。但在使用时需要注意bounding box的准确性和在特定情况下的局限性。 ### 回答3: bounding box作为optical flow光流的输入,是指在目标跟踪或目标检测任务中,使用bounding box来框定目标区域,并将该区域作为输入,进行光流计算。 光流是一种用于分析图像中像素运动的技术。它能够通过比较相邻帧中的像素位置变化,推测像素的运动方向和速度。为了准确地计算光流,需要选择合适的输入区域。而bounding box提供了一个有效的方式来定义并限制光流计算的区域,以便准确地追踪目标的运动。 具体而言,使用bounding box作为光流的输入可以带来以下优势: 1. 限定区域:bounding box可以将光流计算限定在目标区域内,从而排除其他背景区域的干扰。这样可以提高光流的计算精度和效率。 2. 快速目标跟踪:光流可以用于目标跟踪任务,而bounding box提供了目标的初始位置信息。通过光流计算,可以根据目标的运动轨迹对目标进行跟踪,并及时更新bounding box的位置。 3. 目标检测准确性:光流可以用于目标检测任务,通过计算不同帧之间的光流变化,可以检测出目标的运动。而bounding box则可以用来获取目标在当前帧中的位置,从而进一步提高目标检测的准确性。 总之,使用bounding box作为optical flow光流的输入,可以更好地限定光流计算的区域,提高光流的计算精度和效率,同时也可以用于目标跟踪和目标检测任务。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值