浅谈对Skeleton-Based Action Recognition with Directed Graph Neural Networks,基于骨架的有向图神经网络动作识别理解

作者提出因为骨骼数据中的关节和骨骼信息对动作识别任务都有很大的帮助,所以研究出一种利用关节和骨骼之间的关系即人体骨头的方向和长度还有与关节点坐标信息的互补来完成一个动作识别的任务非常具有优势。作者首次将骨骼数据表示为一种有向无环图。在骨骼中引入方向进一步挖掘出骨骼,关节与动作识别之间的关系。并且还设计了一个相对应的有向图卷积网络。因为数据集是原始骨架数据是一系列帧,每个帧都包含一组关节坐标。给定骨骼序列,和关节的二维或三维坐标。作者会先把将每个帧中的关节和骨骼(空间信息)表示为有向无环图中的顶点和边缘。并将其输入有向无环图神经网络(DGNN)中提取特征进行动作识别。最后与基于RGB视频的CNN卷积提取空间信息相结合进一步提高性能。 因为骨骼表示为两个连接关节之间的坐标差,一般处理骨骼数据方法都是将骨架数据建模为一个向量序列或一个伪图像,然后投喂到RNNs或CNNs处理。但是,这样话无法提取到关节和骨骼之间的依赖关系。以前骨骼数据的处理都是把它看成一个树形结构,但是在论文中作者把它重新定义为向非循环图(DAG),关节为顶点,骨骼为边。每条边的方向由顶点和根顶点之间的距离确定。类似于下图这种:

相邻关节骨骼方向离根顶点较近的顶点指向离根顶点较远的顶点,比如手腕的关节由肘部的关节指向它,通过这种有向图方式表示相邻关节之间上下依赖关系。剩下问题如何使用这些依赖关系对动作识别进行一个提升。作者提出了一种有向图神经网络(DGNN),通过邻接矩阵设置为骨骼序列相邻关节依赖关系初始权重的网络参数标签,但是在图卷积基础上提取一个关节及其传入边,传出边的关节和骨骼信息。经过过DGNN的处理得到n个关节的m个特征向量。由这个特征向量中的最大值所表示的局部关节的动作依赖权重值与动作分类形成一个一一映射关系已达到动作识别的目的。最后通过加上RGB视频的CNN卷积得到时间空间信息的特征向量使得模型识别精度得到一个进一步提高。

 

  • 1
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
"Channel-wise Topology Refinement Graph Convolution for Skeleton-Based Action Recognition" 是一篇关于基于骨架动作识别的论文。如果要提出改进方法,可以考虑以下几个方向: 1. 模型结构改进:可以尝试改进论文中提出的Channel-wise Topology Refinement Graph Convolution模块。例如,可以探索更复杂的卷积模型结构,引入更多的注意力机制或者跨层连接,以提高模型对骨架数据的建模能力。 2. 数据增强和预处理:骨架数据可能存在缺失或者噪声,可以尝试使用数据增强技术(如旋转、平移、缩放)来增加数据的多样性和鲁棒性,或者使用预处理技术(如滤波、插值)来处理数据中的噪声和缺失。 3. 结构优化:可以尝试优化骨架数据的结构表示。例如,可以使用剪枝算法来去除冗余的边或节点,或者使用生成算法来自动构建更准确的结构。 4. 跨模态信息融合:可以考虑将骨架数据与其他传感器数据(如深度像或RGB像)进行融合。通过融合不同模态的信息,可以提高对动作理解识别能力。 5. 模型训练优化:可以探索更有效的模型训练方法,例如引入更合适的损失函数或者优化算法。此外,可以尝试使用迁移学习或领域自适应的方法,将从其他相关任务或领域中学到的知识迁移到骨架动作识别任务中。 以上是一些可能的改进方向,具体的改进方法需要根据具体问题和实验结果来确定。同时,也可以参考相关领域的最新研究和技术进展,以获取更多的启发和创新点。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值