动作识别之STIP (Space-Time Interest Points)（三）

最新推荐文章于 2022-10-14 21:05:02 发布

MultiMediaGroup_USTC

最新推荐文章于 2022-10-14 21:05:02 发布

阅读量1.4k

点赞数

分类专栏： Action Recognition 文章标签： Action Recognition

Action Recognition 专栏收录该内容

7 篇文章 0 订阅

订阅专栏

转载出处：http://blog.csdn.net/jyfan91/article/details/43055843

读C. Schüldt, I. Laptev, and B. Caputo. Recognizing human actions: A local SVM approach. ICPR, 2004.

这篇文章是对 “动作识别之STIP (Space-Time Interest Points)（一）”中介绍的两篇文章的扩展，利用前面文章中的jets描述器，训练SVM分类器，实现动作识别。文章主要分为如下几个部分：

Detector and descriptor

略，见“动作识别之STIP (Space-Time Interest Points)（一）”。

Classifier

对于直方图特征(H)，用卡方核。

$K(x,y)=exp(-\gamma \chi ^{2}(x,y))$

对于局部特征(LF)，用核。

$K_{L}(L_{h},L_{k})=1/2[\hat{K}_{L}(L_{h},L_{k})+\hat{K}_{L}(L_{k},L_{h})]$

其中：

$\hat{K}_{L}(L_{h},L_{k})=\frac{1}{n_{h}}\sum_{j_{h}=1}^{n_{h}}\underset{j_{k}=1,...,n_{k}}{max}(K_{l}(l_{j_{h}},l_{j_{k}}))$

$L_{i}=(l_{j_{i}})_{j=1}^{n_{i}}$ ， $l_{j_{i}}$ 是序列i中的第j个兴趣点的jet描述子。

$K_{l}(x,y)=exp(-\rho(1-\frac{<x-\mu _{x}|y-\mu _{y}>}{\left \| x-\mu _{x} \right \|\cdot\left \| y-\mu _{y} \right \| }))$

$\mu _{x}$ 是x的均值。

实验

(1)实验设置

采用KTH数据集做实验。分为s1（户外）、s2（不同尺度）、s3（不同衣服）、s4（户内）四中不同场景。分为训练集、验证集、测试集3个部分。训练集用来训练分类器，验证集用来得到最优参数，测试集用来测试最后的识别结果。

(2)实验方法

比较3种描述器的的表示方法，和2种分类器的识别结果。

(i)representation

1. LF，四阶jets，描述局部时空特征。

2. HistLF，用128bin的直方图统计LF。

3. HistSTG，分别利用4种时间尺度，计算归一化的时空梯度直方图，联合起来构成时间金字塔。

(ii)classification

1.两种核的SVM，一种是局部特征LF核的SVM，另一种是卡方核(用来分类HistLF和HistSTG)。

2.最近邻分类器(NNC)，用来分类HistLF和HistSTG。

(3)实验结果

1.LF+SVM的识别率最高。

2.对于每种方法，用来做训练的视频数量越多，识别率越高。

3.对于直方图表示，SVM比NNC效果好，HistLF比HistSTG效果好一点。

4.最容易混淆的是jogging和running，boxing和hand clapping，可以用这些类的相似度高来解释。

5.尺度变化的场景的序列s2是最难识别的，LF+SVM的识别率与其他序列上识别率相差不多，说明LF具有尺度不变性。

(4)匹配局部特征

在不同的序列使用核 $K_{L}(\mathbf{L}_{h},\mathbf{L}_{K})$ 来匹配对应的兴趣点，可以得到一些匹配对。可以得到相同类型的匹配对（都是跑步的角点），也可以得到不同类型的匹配对（一个是跑步的角点，另一个是慢跑的角点）。为了改进LF特征这种缺点，需要考虑特征的时空一致性。