光流网络：FlowNet

访风景于崇阿

已于 2023-04-11 16:19:37 修改

阅读量420

点赞数

分类专栏：光流估计文章标签：深度学习

于 2023-04-11 16:04:34 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/starlight1231/article/details/130083727

版权

FlowNet是首个使用CNN预测光流的深度学习模型，通过不同的网络结构如FlowNetSimple和FlowNetCorr处理光流预测。FlowNet2.0通过增加训练数据、改进训练策略、堆叠网络结构和处理小位移情况，提升了预测精度，与传统方法相当，同时保持了高效运行速度。

摘要由CSDN通过智能技术生成

目录

1. FlowNet (2015)

1. 什么样的网络结构具有光流预测能力呢？

2. 根据输入方式的不同，FlowNet又分为FlowNetSimple和FlowNetCorr

3. FlowNet实验

2. FlowNet2.0 (2017)

1. 训练数据

2. 训练策略

3. 利用堆叠的结构对预测结果进行多级提升

4. 针对小位移的情况引入特定的子网络进行处理

1. FlowNet (2015)

光流具有丰富的运动信息，因而在运动估计、自动驾驶和行为识别方面都有广泛应用。

FlowNet是第一个尝试利用CNN去直接预测光流的工作，它将光流预测问题建模为一个有监督的深度学习问题。模型框架如下：

如图1输入端为待求光流的图像对I_1，I_2，输出端为预测的光流W。

那么问题来了，

1. 什么样的网络结构具有光流预测能力呢？

FlowNet中提出了两种可行的网络结构。

网络整体上为编码模块接解码模块结构，编码模块均为9层卷积加ReLU激活函数层，解码模块均为4层反卷积加ReLU激活函数层，在文中解码模块又被称为细化模块。整个网络结构类似于FCN(全卷机网络)，由卷积和反卷积层构成，没有全连接层，因此理论上对输入图像的大小没有要求。

2. 根据输入方式的不同，FlowNet又分为FlowNetSimple和FlowNetCorr

FlowNetS（FlowNetSimple）直接将两张图像按通道维重叠后输入。

FlowNetC （FlowNetCorr）为了提升网络的匹配性能，人为模仿标准的匹配过程，设计出“互相关层”，即先提取特征，再计算特征的相关性。相关性的计算实际上可以看做是两张图像的特征在空间维做卷积运算。

在解码细化的过程中，对每层的反卷积ReLU层，不仅输入前一层的输出，同时还输入前一层预测的低尺度的光流和对应编码模块中的特征层。这样使得每一层反卷积层在细化时，不仅可以获得深层的抽象信息，同时还可以获得浅层的具象信息，以弥补因特征空间尺度的缩小而损失的信息。

3. FlowNet实验

最低0.47元/天解锁文章

访风景于崇阿

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。