图卷积在动作识别方向的应用_图卷积神经网络在人体动作识别中的应用-CSDN博客

本文链接：https://blog.csdn.net/weixin_48167570/article/details/116916086

本文探讨了细粒度图像分类的难点及关键算法，包括基于强监督信息和弱监督信息的分类模型。同时介绍了骨架动作识别中的人体骨架特征提取方法，如基于局部划分的图卷积网络(PBGC)以及空间残差层和密集连接块增强的时空图卷积网络。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1. 预备知识

细粒度分类

细粒度图像分析任务相对通用图像（general/generic images）任务的区别和难点在于其图像所属类别的粒度更为精细（通用：狗和袋鼠的区分；细粒度：哈士奇与爱斯基摩犬的区分）。而细粒度图像分析任务也主要以细粒度图像分类为主，细粒度物体的差异仅体现在细微之处。如何有效地对前景对象进行检测，并从中发现重要的局部区域信息，成为了细粒度图像分类算法要解决的关键问题。对细粒度分类模型，可以按照其使用的监督信息的多少，分为“基于强监督信息的分类模型”和“基于弱监督信息的分类模型”两大类。

基于强监督信息的分类模型：Part-based R-CNN；Pose Normalized CNN；Mask-CNN
基于弱监督信息的分类模型：Two level Attention Model；Constellations；Bilinear CNN

预备知识链接：预备知识
学习参考：阅读原文

R-CNNs具体步骤
-一张图像生成1k-2k个候选区域
-对每个候选区域使用深度神经网络提取特征
-特征送入每一类的SVM分类器，判别是否属于该类
-使用回归器精细修正候选框位置
速度：仅在候选区域提取特征，较传统方法会快很多
训练集：传统是在提取人工设定的特征，而这个是使用识别库和检测库进行调优测评[R-CNNs][1]

典型的 part-based 方法，将人体骨架分为多个子图，定义了子图内部和子图之间的信息传播方式，这样便能更好的抽取局部关节信息，同时加快信息传播速度。