Adversarial Self-Supervised Learning for Semi-Supervised 3D Action Recognition

最新推荐文章于 2023-02-23 11:29:29 发布

的斯帕瓦

最新推荐文章于 2023-02-23 11:29:29 发布

阅读量386

点赞数

分类专栏：学习笔记文章标签：深度学习人工智能 python

本文链接：https://blog.csdn.net/a1013552415/article/details/108846080

版权

学习笔记专栏收录该内容

4 篇文章

订阅专栏

该研究提出了一种对抗自监督学习（ASSL）框架，旨在解决半监督3D动作识别问题。通过结合自监督学习与对抗学习，ASSL能够从大量未标记的骨骼序列中学习动作表征。文章指出直接应用自监督学习可能导致有标签和无标签样本的学习不一致，为此引入了邻居一致性策略，通过K近邻和信息聚合增强类别语义。此外，还提出了一种对抗正则化方法来对齐有监督和自监督学习的特征分布，提高模型的泛化能力。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Adversarial Self-Supervised Learning for Semi-Supervised 3D Action Recognition

Abstract
自监督学习（SSL）已被证明在图像域中从未标记数据中学习表示非常有效。目前，针对三维动作识别的有效自监督方法还不多见，直接将SSL应用于半监督学习，存在从SSL学习到的表征与有监督学习任务不一致的问题。为解决这个问题。作者提出对抗自监督学习（ASSL），它通过领域关系提取和对抗学习把SSL和半监督方法结合。
Introduction
最近，SSL被提出通过骨骼图用来学习未标签序列的时间信息，但SSL把每一个样本都视作独立个体，因此忽视了样本中相似动作所共有的信息。
直接将SSL应用于半监督学习，存在自监督学习任务和有监督学习任务学习结果不一致的问题。受unsupervised domain adaptation (UDA)中对抗学习的启发，把adversarial learning与self-supervision结合进semi-supervised learning中。
main contributions:
1.我们为半监督3D动作识别提出了一个对抗自监督学习（ASSL）框架，它通过对抗学习和领域关系探索把SSL和半监督方法紧密的结合。
2.我们提出了一个新的自监督方案，i.e.，邻居一致性。通过研究领域的数据联系，模型能学习到不同的动作表征。
3.我们确定了直接将SSL应用于半监督学习，存在有标签样本与无标签样本学习结果不一致的问题。一个新颖的对抗正则化被提出将SSL与半监督算法结合，以对齐两者的特征分布，这能进一步的提升泛化能力。
problem frmulation
使用很少的标签数据在半监督3D动作识别。首先， $X$ 代表训练集。训练样本 $x_i\in X$ 是带有T帧的骨骼序列，与有监督3D动作识别不同，训练集被分为两部分：有标签集 $X_L$ ，无标签集 $X_U$ 。受 $S^4L$ 启发，我们提出了对抗自监督学习架构来学习两个训练集的不同动作表征。
neighborhood consistency
半监督3D动作识别的目的是学习有区别的动作表征从大量的无标签序列。然而，很难获得简洁的3D人类姿势。为解决这个问题，我们提出了一个高效的SSL策略，领域一致性，一吃增强潜在的类别语义的动作表征。
在这里插入图片描述
如图，我们首先应用skeleton inpainting学习无标签序列的时间信息。具体来说，编码器网络Encr把输入骨骼序列 $x_u$ 生成为时间特征 $h_u$ 。一个解码器网络Dec目标是填充输入序列的masked region，为了区分在动作分类（区别）和骨骼修补（回归），我们使用了一个翻译层，例如，一个线性层搭建两者特征空间的关系。线性层的样本 $x_u$ 的输出表示为 $\overline{h}_u$ 。在这个特征空间，我们应用K-nearest neighborFon从未标签训练集 $X_U$ 来选择K最近邻居。 $x_u$ 的邻居集被表示为 $\Omega _x$ 。一个信息聚合模型被提出老生成局部中心向量。我们使用多重感知机来分配每一个邻居样本的权值，评估他们的相似性，权值 $\alpha _k$ 计算如下：
在这里插入图片描述
上式 $\overline{h}^k_u$ 是邻居样本 $x_u^k$ 被翻译的特征， $M L P ()$ 表示多重感知机，通过被计算的权重{ $\alpha_1,...,\alpha_K$ }，局部类中心 $c_u$ 被聚类为：