Hello,今天是论文阅读计划的第5天啦。
今天这篇论文比较简单,没有什么特别复杂的技术。
一、论文题目关键词提取
Richly:丰富地。为什么称之丰富的呢?丰富地激活了什么呢?
Robust: 鲁棒的。提取的特征更具备鲁棒性?
带着疑问往下阅读。
二、研究背景
这个NTU数据集上目前都是直接识别分类的,但实际真实情况下,会出现物体遮挡、自遮挡等情况。现有的算法在缺失的情况下,性能下降非常多非常快。本篇论文的Baseline是ST-GCN。
三、研究目标 & 内容
目标:提升ST-GCN的准确率,在遮挡的情况下,尽可能的减少性能损失
内容:通过设计多流的方式,使用MASK的方式来将已经激活的节点过滤掉,强制在还未识别到的关节点上进行识别,来激活那些还未识别到的关节点,提取到更丰富的特征。
四、方法
整体框架图:
注意他的数据处理这部分,将原数据x进行了时间差得到Motion运动信息,以及将原数据x做了相对坐标的处理,然后将其Concat起来形成了9维数据。
模型这部分呢主要是将ST-GCN的模型重复了三流,这中间使用了CAM的方式来保存和传递信息,是下一流的模型更能专注在那些还未被识别到的关节点上。
损失函数