视频行为识别论文阅读[4]

[9]A Key Volume Mining Deep Framework for Action Recognition[2016CVPR]

之前介绍的文章很多都是不同的融合技巧,这一篇文章是从输入入手,提取关键帧进行检测。
大多数现有的深度框架同等地处理每一个视频片段,例如,空间 - 时间视频切片,并直接将视频标签分配给所采样的片段。 然而,在视频中,有歧义的动作可能在几个视频片段中稀疏地产生,并且大多数与标记的操作类别无关。 大量不匹配样本会阻止我们去学习重要的特点捕获重要的分类。
论文的重要思想就是在前向传递中,我们将一包视频段输入我们的网络,然后根据响应挖掘每个操作的关键视频片段; 在后向传递中,我们借助这些关键卷更新网络参数。文中核心在于关键视频段的判定方式。
这里写图片描述

[10]AdaScan: Adaptive Scan Pooling in Deep Convolutional Neural Networks for Human Action Recognition in Videos

这也是一个从关键帧提取入手的动作识别方案。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值