动作识别概况

本文概述了动作识别技术,包括其难点、常用方法和数据集。介绍了传统方法如iDT和现代深度学习方法如two-stream、i3D等。还探讨了Action Recognition和Temporal Action Localization两个方向,以及HMDB51、UCF-101等数据集,最后提到了一些常用框架,如iDT、C3D和I3D。
摘要由CSDN通过智能技术生成

一、动作识别

主要目标是判断一段视频中人的行为的类别,所以也可以叫做 Human Action Recognition。

二、动作识别的难点

1.类内和类之间差异, 同样一个动作,不同人的表现可能有极大的差异。

2.环境差异, 遮挡、多视角、光照、低分辨率、动态背景.

3.时间变化, 人在执行动作时的速度变化很大,很难确定动作的
起始点,从而在对视频提取特征表示动作时影响最大。

4.缺乏标注良好的大的数据集

三、动作识别现在常用的方法

1.传统方法:iDT
(1)密集轨迹算法(DT算法)

2.当前深度学习的方法
(1)GB+光流(two-stream、TSN)
(2)i3D、3D、(2+1D)卷积
(3)RNN(LSTM/GPU)

四、行为识别的两个方向

1.Action Recognition:
给定一个视频片段进行分类,一般使用的数据库都先将动作分割好了,一个视频片段中包含一段明确的动作,时间比较短。(其实就是输入一个视频,输出其动作分类)常用数据库:UCF101,HMDB51等等

2.Temporal Action Localization:
不仅要知道动作在视频中是否发生,还要知道动作发生在视频的哪段时间(开始和结束时间)。特点是处理较长的、未分割的视频。而且视频通常有较多的干扰,目标动作一般只占视频的一

  • 4
    点赞
  • 74
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值