动作识别之STIP (Space-Time Interest Points)(三)

转载出处:http://blog.csdn.net/jyfan91/article/details/43055843


读C. Schüldt, I. Laptev, and B. Caputo. Recognizing human actions: A local SVM approach. ICPR, 2004.    
     这篇文章是对 “动作识别之STIP (Space-Time Interest Points)(一)”中介绍的两篇文章的扩展,利用前面文章中的jets描述器,训练SVM分类器,实现动作识别。文章主要分为如下几个部分:
Detector and descriptor
     略,见“动作识别之STIP (Space-Time Interest Points)(一)”。
Classifier
     对于直方图特征(H),用卡方核。
     
     对于局部特征(LF),用核。
     
     其中:
            
     是序列i中的第j个兴趣点的jet描述子。
     
      是x的均值。   
实验
(1)实验设置
     采用KTH数据集做实验。分为s1(户外)、s2(不同尺度)、s3(不同衣服)、s4(户内)四中不同场景。分为训练集、验证集、测试集3个部分。训练集用来训练分类器,验证集用来得到最优参数,测试集用来测试最后的识别结果。
(2)实验方法
     比较3种描述器的的表示方法,和2种分类器的识别结果。
(i)representation
1. LF,四阶jets,描述局部时空特征。
2. HistLF,用128bin的直方图统计LF。
3. HistSTG,分别利用4种时间尺度,计算归一化的时空梯度直方图,联合起来构成时间金字塔。
(ii)classification
1.两种核的SVM,一种是局部特征LF核的SVM,另一种是卡方核(用来分类HistLF和HistSTG)。
2.最近邻分类器(NNC),用来分类HistLF和HistSTG。
(3)实验结果
1.LF+SVM的识别率最高。
2.对于每种方法,用来做训练的视频数量越多,识别率越高。
3.对于直方图表示,SVM比NNC效果好,HistLF比HistSTG效果好一点。
4.最容易混淆的是jogging和running,boxing和hand clapping,可以用这些类的相似度高来解释。
5.尺度变化的场景的序列s2是最难识别的,LF+SVM的识别率与其他序列上识别率相差不多,说明LF具有尺度不变性。
(4)匹配局部特征
     在不同的序列使用核来匹配对应的兴趣点,可以得到一些匹配对。可以得到相同类型的匹配对(都是跑步的角点),也可以得到不同类型的匹配对(一个是跑步的角点,另一个是慢跑的角点)。为了改进LF特征这种缺点,需要考虑特征的时空一致性。
     LF对于复杂不稳定的背景具有鲁棒性。

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值