本文由Xiaojiang Peng发表在计算机视觉顶级国际会议ECCV2014。由标题可以看出作者是利用分层的Fisher Vectors做行为识别。作者的动机是想将特征的维度做高。这种分层的做法近几年比较常见,如 ICRA 2014关于3d点云无监督特征的论文Unsupervised Feature Learning for 3D Scene Labeling,ICRA的这篇论文做了两层的Sparse Coding,在Sparse Coding的基础上做Sparse Coding。
本文框架
如图1所示,作者给出了本文基于Fisher Vectors的框架和传统的基于Fisher Vectors的框架不同。本文做了两层的Fisher Coding,在得到底层特征的Fisher Vectors后,在Fisher Vectors的基础上得到新的Fisher Vectors。第二层输出的Fisher Vectors即作者所称的 Stacked Fisher Vectors (SFV),在做分类时可直接将SFV导入分类器中。作者通过实验验证,将FV同SFV串联起来形成高维特征效果要比单独用FV或者SFV效果更好。小结下本段的意思,SFV是FV上的特征,即关于特征的特征,即中层特征。
本文算法
第一层Fisher Vectors 提取
提取第一层的目的是为第二层的Fisher Vecto