提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档
前言
骨架动作识别的最早尝试往往是将每帧中所有的身体关节点位置编码为一个特征向量,用于模式学习。这些模型很少探索身体关节之间的内部依赖关系,导致遗漏了丰富的动作信息
文章略读
1.与ST-GCN的对比
使用广义骨架图进行特征学习。动作链接和结构链接捕获了关节之间的依赖关系。对于动作"行走",动作连接表示手和脚是相关的。右体上的半透明的圆是用于识别的联合特征图,其面积为响应幅值。与ST - GCN相比,AS - GCN在协作运动关节(红色方框)上获得响应。
ST - GCN虽然提取了通过骨骼直接连接的关节的特征,但结构上较远的关节,可能覆盖关键的动作模式,在很大程度上被忽略。例如,在行走时,手和脚是强相关的。而ST - GCN则尝试用层次GCN聚合更广范围的特征,但在长时间扩散过程中节点特征可能会被削弱。
行走的骨架图、S -链接和A -链接的示例。在每个情节中,从"左手"到它的邻居的链接都以实线表示。( a )具有有限邻近范围的骨架链接;( b ) S形连接,允许"左手"连接整个手臂;( c ) A-links,捕捉长程动作特异性关系
2.具体流程
本文提出的AS - GCN的流程。将推断的动作图A -链接和扩展的结构图S -链接输入到AS - GCN块中学习空间特征。最后一个AS - SCN块连接两个并行的分支,即识别头和预测头,同时进行训练。
3.编码器解码器
本文提出了一个具有编码器-解码器结构的A - link推理模块( AIM )。