其中testlist01和trainlist01对应,对于每类合在一起是25group,其中test包括7group,train为剩余的25-7 group。每个group又包含4-7个剪辑
上图中testlist01、02、03只是交叉取group,分别是前、中、后8group。模型学习时,只取其中01对应的train和test就行
下图是用3Dharris角点词袋模型,做动作识别,1-50 运动,51–60乐器演出, 61-80 人-物交互,97-101人人交互
预定义动作类型的准确性为:运动(49.40%)、演奏乐器(42.04%)、人与物交互(36.62%)、仅身体动作(37.64%)、人与人交互(42.66%)。运动动作可以达到最高的精度,因为运动通常需要独特的动作,这使得分类更加容易。此外,与其他动作类型相比,运动片段的背景通常不那么杂乱。与体育动作不同,人机交互剪辑通常具有高度杂乱的背景。此外,信息性动作通常只占剪辑动作的一小部分,这就解释了该动作类识别精度低的原因。