python视频识别_视频人员行为识别（Action Recognition）

最新推荐文章于 2024-09-10 08:36:44 发布

weixin_39909212

最新推荐文章于 2024-09-10 08:36:44 发布

阅读量2.8k

点赞数 1

文章标签： python视频识别

本文介绍了视频行为识别技术，从传统的iDT方法到深度学习的Two Stream和C3D Network，探讨了如何通过分析视频来识别人员动作，并列举了一些常用的数据集。

摘要由CSDN通过智能技术生成

一. 提出背景

目标：给定一段视频，通过分析，得到里面人员的动作行为。

问题：可以定义为一个分类问题，通过对预定的样本进行分类训练，解决一个输入视频的多分类问题。

这里提出的问题是简单的图片(视频)分类问题，该问题的前提条件是：场景目标为单人，并且占据图片比较大的比例，如下图所示：

还有一类问题是基于行人检测，去估计行人的姿态和动作，暂时不在本篇讨论范围内。

二. 行为识别的发展

和其他领域一样，我们还是先从未被深度学习攻占的传统方法讲起，我们标记的里程碑算法是 iDT。

iDT 方法是基于 DT(Dense Trajectories)方法，第一印象可以理解为稠密光流的轨迹。

如图所示，我们将算法描述为以下步骤：

1)在原始图像多尺度上进行密集特征点采样，采样间隔为W(上图左)；

2)进行有效的特征点筛选(只保留有用的)，这里选用的方式是基于自相关矩阵的特征值；

和直接通过surf去选择特征点的思路基本上一样。

该 Step 形成空域信息。

3)跟踪特征点，在时间轴形成特征点的轨迹序列(上图中)；

该 Step 形成时域信息。

4)对应每个时间片上的每个特征点，在该点影响范围内分别进行特征采样(HOG、HOF、MBH)(上图右)，

对序列进行编码(Fisher Vecto

最低0.47元/天解锁文章

weixin_39909212

关注

1
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。