Centrality Graph Convolutional Networks for Skeleton-based Action Recognition
基于骨架的动作识别的中心图卷积网络
CVPR2020
骨架数据拓扑结构:建模仅考虑关节和骨骼之间的连接并直接使用物理信息。
centrality graph convolutional networks:发现被忽视的拓扑信息;并最好利用这些信息来区分关键关节、骨骼和身体部位
- 突出关键关节、骨骼、身体部位
- 图论中定义了中心性以标识图中最重要的节点,边或子图。图模型是在一系列骨架图的顶部制定的,其中每个节点都反映了人体的关节。同时对物理连接和断开的关节之间的关系进行建模,从而可以有效地捕获低级和高阶骨架信息。
- 基本结构学习中心性特征,例如关节中心性,骨骼中心性和子图中心性,称为中心性模块。中心度模块通过紧密度,特征向量和三元组子图计算可以从骨架数据中获得特征拓扑特征。该模块还以注意力机制反映内生依赖性,以增强群集性能。
- 将提取的特征编码到时空模块中,以进行进一步的训练。
- CGCN是第一个突出中心结构的工作,例如人体动作的关键关节,骨骼和身体部位。它旨在发现人体骨骼的物理连接和非连接部分之间被忽略的信息。
- CGCN在设计中心模块时遵循几种图形机制,以满足人类行为的特定要求,可以提供对动作识别任务的新的深刻理解。
- 提取连续帧之间的运动信息以用于时间信息建模。空间和运动信息都被输入到一个四通道的框架中,用于动作识别任务。
- 在基于骨架的动作识别的两个大型数据集上,优于最新方法。结果表明,这些中心结构是隐藏在骨架拓扑中的基本机制和因素,为人类动作识别带来了显着改善。
GCN:对GCN建模的各种方法分为两类,包括空间方法和光谱方法。空间方法使用图论来定义数据上实体的节点和边[12,3]。有趣的是,频谱方法会在频域中分析构建的图[16,9]。频谱方法通常利用拉普拉斯特征向量将图在时域内转换为频域内,潜在地导致大量计算成本[16]。考虑到人类动作识别,由于骨架数据量大,大多数方法选择空间方法来构建GCN。由于人体自然形成为图形,而不是序列或图像,因此可以轻松地从骨骼数据中提取相关特征。但是,他们的工作仅集中在静态图结构上,很难从人类行为中了解动态信息。在这里,我们的模型可以自适应地提取有关关节,骨骼和身体部位的关键信息,从而生成动态GCN。此外,CGCN结合了高级信息,为学习人类行为提供了新的见解。
spatial graph construction:
提取特征向量: z = g ( θ ) ⋆ x = U g ( θ ) U T x z=g(\theta)\star x=Ug(\theta)U^Tx z=g(θ)⋆x=Ug(θ)UTx
Centrality graph convolutional networks:
joint centrality:
在图论中,归一化的紧密度中心度是测量空间距离中两个节点之间的相关性的合理解决方案。在连通图中,节点的紧密度中心点是该节点与所有其他节点之间最短路径的平均长度。距离倒数 N c ( i ) = N − 1 ∑ j d ( i , j ) N_c(i)=\frac {N-1}{\sum_j d(i,j)} Nc