【论文笔记】光流在视频行为识别中的作用

该论文研究了光流在视频行为识别中的作用,发现光流的表观特征不变性而非动态信息是其有效性的关键。光流的精度与行为识别精度无强相关性,但在边界和小位移处的精度影响较大。通过对光流网络以行为识别损失函数微调,能提升识别性能。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Paper:On the Integration of Optical Flow and Action Recognition
Author:Facebook,Zhejiang University,MPI for Intelligent Systems,NVIDIA

0. 引言

在做视频行为识别时,特别是基于two-stream框架时,常常会引入光流图作为双流网络其中一支的输入。这是很常用,且在各数据集上已被证明有效的做法。但是,关于光流在行为识别中到底起到了什么作用其实并没有明确的研究。通常我们认为光流代表了视频的motion信息,可以和帧图像的appearance信息形成互补,从而提高双流模型的效果。
那么是否真的是这样呢?本文探讨了光流对于行为识别有用的原因。首先给出本文的结论,有些结论可能有点反直觉:
(1)光流对于action recognition有用是因为它的表观特征不变性(而不是动态信息)
(2)光流方法优化时通常采用end-point-error(EPE),但是EPE的好坏和action recognition的性能没有强相关性
(3)从测试的光流算法看,光流在边界处和小位移处的精度对于提升action recognition的性能有强相关
(4)以最小化分类误差为目标去训练光流比最小化EPE更能提升action recognition的性能
(5)以action recognition为目标学习到的光流和传统的光流不相同,特别是在人体

评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值