RA-GCN:Richly Activated Graph Convolutional Network for Robust Skeleton-based Action Recognition

Richly Activated Graph Convolutional Network for Robust Skeleton-based Action Recognition

TCSVT2020

丰富的激活图表卷积网络,用于基于骨骼的骨骼动作识别


现有方法大多使用完整的骨架,但是现实生活中,捕获不完全的或嘈杂的骨架是不可避免的,当某些信息关节被遮挡或受到干扰时,这可能会降低性能。探索在所有骨架关节上传播充分辨别特征使得分布式冗余表示将动作模型的灵敏程度降低到非标准骨架。具体地,一系列有序流延伸骨干GCN,该流是通过前面流较少激活的关节学习辨别特征。通过类激活映射class activation maps(CAM)测量每个GCN流的骨架关节激活程度。并且只有来自未激活的关节的信息将被传递到下一个流,通过其获得所有源关节丰富的特征。richly activated GCN(RA-GCN)。

在这里插入图片描述

显示了由于场景中的其他人而显示的一些遮挡行为的示例。嘈杂的数据将严重损坏模型的性能。因此,如何增强基于骨架的动作识别模型的稳健性仍然是一个紧迫和具有挑战性的问题。

在本文中,通过集合学习的成功启发,文章提出了一种基于GCN的多流模型,旨在从骨架运动序列中学习丰富的鉴别特征,从而提高所提出的模型的鲁棒性。方法中每条流的目的是探索以前流未激活的骨架关节上的一组有区别的特征。**骨架关节上的已经学习了的多余但互补的特征提供了处理嘈杂或不完整的骨架数据的有效策略。**例如,当我们认识到动作投掷时,最多的有区别的关节位于对象投掷过程中的两臂之间,而身体摇曳以及手的上下文的子行动也可以用来推断投掷的行动。

为了区分每个流中最具有信息性的关节,文章成功引入技术:class activation maps(CAM),它最初旨在在负责可视分类的最终CNN层可视化激活的热图。通过之前的GCN流获得的activation maps被累计作为掩模矩阵mask matrix来告诉新流哪些关节已经被激活了。新流将会被迫从未激活的关节中探索新的可区分的特征。richly activated GCN (RA-GCN),在丰富的发现和互补性特征将提高模型对非标准骨架的鲁棒性。第一次采用CAM来通过扩展激活骨架关节来减轻骨架行为识别中闭塞和抖动问题。

Y.-F. Song, Z. Zhang, and L. Wang, “Richly activated graph convolutional network for action recognition with incomplete skeletons,” in IEEE Int. Conf. Image Process (ICIP), 2019.

  1. 在以前的工作中,激活掩码是通过激活模块中softmax函数获得的,旨在每个流激活一些关节。相反,现在提出使用归一化激活函数来扩展激活范围,因此相应的流将会获得一个更好的更好说明的激活图activation map。
  2. 和之前工作相比,文章将原来的损失函数扩展到每个单独的网络流上的许多额外的跨熵正常化cross-entropy regularizations,以便更有效的学习特征。
  3. 合成的数据集由更多的劣化运算符扩展,其中遮挡劣化进一步分为四种类型,包括帧、部分、块和随机,并且新构造了两个合成抖动集,进行更多实验以验证所提出的方法在不同降解条件下的有效性和鲁棒性。

在这里插入图片描述

RA-GCN来探索所有骨架关节的充分可区别性的特征,构造多留网络,每个流都负责从一组激活的关节中提取特征。以这种方式,当由第一个流提取的关节被遮挡了,该模型还是可以从其他流中发现可区分的信息。

V是关节数,T是一个序列的帧数,输入数据 x \bf x x的大小为 C i n × T × V , C i n = 1 C_{in}\times T\times V,C_{in}=1 Cin×T×V,Cin=1

提出的方法包括三个主要步骤:

  1. 在预处理模块,对提取更加具有信息的特征,输入数据x被转换为x‘,随后被送入所有GCN流。
  2. 对每个流,x’的骨骼关节将被掩模矩阵逐元素相乘过滤,该掩模矩阵记录了最近未被激活的关节。这些关节通过积累同前面流激活模块而计算的激活图activated maps来区分。每个流的掩码矩阵被初始化为和x‘相同形状的全1矩阵。在掩蔽操作后,每个流的操作只包含前面流中未激活的关节,并通过baseline网络来获得一个基于不完整骨架关节的特征表示。
  3. 所有流的特征在输出模块中连接,并使用带有softmax激活函数的全连接层获得最终输入x。

a)数据预处理:关节的相对坐标比绝对坐标更具有信息量。在模型中应用相对坐标和运动特征的几何特征来增加动作识别的识别信息,在分发到所有GCN流之前要预处理输入数据。相对坐标可以被识别为每个帧中的所有关节和中心关节(中脊柱)的差异,所有关节都转换为相对坐标,对位置变换信息更具有鲁棒性。为了提取更具有信息的运动特征,计算 x ˙ t = x t + 1 − x t \dot{\bf x}_t={\bf x}_{t+1}-{\bf x}_t x˙t=xt+1xt

在这里插入图片描述

b)Richly Activated GCN

1)baseline:ST-GCN

spatial graph convolutional空间图卷积操作: f o u t ( v t i ) = ∑ v t j ∈ B ( v t i ) 1 Z t i ( V t j ) f i n ( v t j ) ⋅ w ( l t i ( v t j ) ) f_{out}(v_{ti})=\sum_{v_{tj}\in{\mathcal B}_{(v_{ti})}}\frac{1}{Z_{ti}(V_{tj})}f_{in}(v_{tj})\cdot {\bf w}(l_{ti}(v_{tj})) fout(vti<

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值