卷积神经网络算法_FlowNet到FlowNet2.0:基于卷积神经网络的光流预测算法

FlowNet是首个利用CNN预测光流的算法,通过合成图像数据解决训练数据不足的问题。FlowNet2.0通过改进训练策略和增加数据多样性,提升了精度,与传统方法相当。其速度优势使其适用于实时系统。FlowNet2-SD针对小位移的改进和多模块融合策略提高了预测质量,展现了CNN在光流预测领域的潜力。
摘要由CSDN通过智能技术生成

6bc021efb1207cee2e6196c6501914cd.png

其它机器学习、深度学习算法的全面系统讲解可以阅读《机器学习-原理、算法与应用》,清华大学出版社,雷明著,由SIGAI公众号作者倾力打造。

  • 书的购买链接
  • 书的勘误,优化,源代码资源

原创声明:本文为 SIGAI 原创文章,仅供个人学习使用,未经允许,不得转载,不能用于商业目的。

导言
光流预测一直都是计算机视觉中的经典问题,同时又是解决很多其他问题的基础而备受关注,例如,运动估计、运动分割和行为识别。随着深度神经网络技术在计算机视觉领域中引发的技术变革,基于深度神经网络的光流预测算法应运而生。本文中,SIGAI将以FlowNet到FlowNet2.0的演变,来和大家一起领略基于CNN(卷积神经网络)的光流算法的诞生与发展。
光流(optical flow)是指平面上,光照模式的变化情况。在计算机视觉领域,是指视频图像中各点像素随时间的运动情况。光流具有丰富的运动信息,因而在运动估计、自动驾驶和行为识别方面都有广泛应用。光流预测通常是从一对时间相关的图像对中,估计出第一张图像中各个像素点在相邻图像中的位置。
光流问题长久以来,主要被基于变分能量模型的优化算法和基于块匹配的启发式算法统治着。随着深度神经网络技术在计算机视觉领域取得的成功,科学家们开始尝试利用深度学习技术的优势去解决光流问题。

FlowNet:新技术的诞生

随着CNN在图像分割、深度预测和边缘预测方面的成功,研究人员思考,同样是每个像素点都要给出预测结果的光流预测问题能否也利用CNN进行预测呢?

FlowNet[1]是第一个尝试利用CNN去直接预测光流的工作,它将光流预测问题建模为一个有监督的深度学习问题。模型框架如下:

250e0be1d522e26fc2b7e8564e895433.png
图1源自[1]

如图1输入端为待求光流的图像对I_1,I_2,输出端为预测的光流W。

W=CNN(θ,I_1,I_2)

其中 W,I_1,I_2均为x,y的函数,x,y为图像中像素的位置坐标。θ为CNN中待学习的参数。通过调节θ,来使网络具有光流预测的能力。

那么问题来了,什么样的网络结构具有光流预测能力呢?

FlowNet[1]中提出了两种可行的网络结构。

网络整体上为编码模块接解码模块结构,编码模块均为9层卷积加ReLU激活函数层,解码模块均为4层反卷积加ReLU激活函数层,在文中解码模块又被称为细化模块。整个网络结构类似于FCN(全卷机网络),由卷积和反卷积层构成,没有全连接层,因此理论上对输入图像的大小没有要求。

根据输入方式的不同,FlowNet又分为FlowNetSimple和FlowNetCorr。

编码模块(如图2):

614c60722cb9602608bed92539de63a3.png

8b4156adb0e04722d7c4c0f6c4e62f03.png
图2源自[1]

FlowNetS(FlowNetSimple) 直接将两张图像按通道维重叠后输入。

FlowNetC &

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
卷积神经网络(Convolutional Neural Network,CNN)在图像形变矫正方面有多种算法和方法。以下是其中一种常用的形变矫正算法: 1. Spatial Transformer Networks(STN):这是一种用于空间变换的卷积神经网络模块。STN可以自动学习图像的形变参数,通过应用仿射变换或非线性变换来矫正图像。STN包括三个主要组件:局部化网络(Localization Network)、网格生成器(Grid Generator)和采样器(Sampler)。局部化网络用于学习图像的形变参数,网格生成器根据参数生成转换后的网格,采样器利用生成的网格对图像进行插值和采样,从而实现形变矫正。 STN算法的优点是可以在端到端的训练中自动学习形变参数,不需要人工标注形变信息。它可以适应不同形状和尺寸的图像,并且在训练过程中可以与其他任务共同学习,如分类或检测任务。然而,STN算法的缺点是对复杂形变的处理能力有限,对于一些非刚性形变或大幅度的形变可能不够准确。 除了STN算法,还有其他一些卷积神经网络形变矫正的方法,如CycleGAN和GAN-based方法、FlowNet和光流估计方法等。这些方法可以通过学习图像之间的映射关系或运动场来进行形变矫正,但它们的具体原理和实现方式可能有所不同。 需要根据具体的应用场景和需求选择合适的卷积神经网络形变矫正算法,并根据实际情况进行调优和改进。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值