论文相关
文章平均质量分 92
论文相关
盖盖的博客
众生皆苦,我是草莓味儿的。
展开
-
复现报错小结
1、os.environ['CUDA_VISIBLE_DEVICES'] = arg.cuda_visible_device报错2、查看显卡使用情况3、zipfile.BadZipFile: File is not a zip file4、AttributeError: module 'numpy' has no attribute 'int'.5、ModuleNotFoundError:No module named xxx6、循环导包的问题7、将conda环境中的Python降版本原创 2024-03-24 10:45:00 · 399 阅读 · 0 评论 -
3DCNN-Based Knowledge Distillation Framework for Human Activity Recognition
本文提出了一个知识蒸馏框架,该框架使用离线知识蒸馏技术从大型教师模型中提取时空知识到轻量级学生模型。所提出的离线知识蒸馏框架采用两个模型:大型预训练 3DCNN(三维卷积神经网络)教师模型和轻量级 3DCNN 学生模型(即教师模型在同一数据集上进行预训练,学生模型要训练)。在离线知识蒸馏训练过程中,蒸馏算法只训练学生模型,帮助学生模型达到与教师模型相同的预测精度水平。短推理时间和高精度使得我们提出的框架适用于实时应用中的人类活动识别。原创 2024-01-12 13:50:51 · 920 阅读 · 0 评论 -
MSST-RT: Multi-Stream Spatial-Temporal Relative Transformer for Skeleton-Based Action Recognition
本文提出时空相对转换器 (ST-RT) 来克服这些缺陷。通过引入中继节点,ST-RT避免了变压器架构,打破了空间维度固有的骨架拓扑和时间维度骨架序列的顺序。此外,挖掘不同尺度运动中包含的动态信息。最后,分别将从四种骨架序列中提取时空特征的四个ST-RT进行融合,形成最终模型、多流时空相对变压器(MSST-RT),以提高性能。原创 2024-01-17 08:15:00 · 1748 阅读 · 0 评论 -
TPAMI 2023:Constructing Stronger and Faster Baselines for Skeleton-based Action Recognition
针对该任务的复杂性和计算代价过高的情况,提出了一种新的有效的图卷积网络基线模型EfficientGCN,并设计了一种复合缩放策略,用于扩展模型的宽度和深度,最终获得一个高准确性、可训练参数较少的高效GCN基线模型。原创 2024-01-13 10:30:00 · 1180 阅读 · 0 评论 -
symmetryMDPI2022(GSTN):A Graph Skeleton Transformer Network for Action Recognition
GCN 主要依靠图拓扑来描述关节之间的依赖关系,在捕获长距离依赖方面受到限制。基于 Transformer 的方法有效地捕获长距离依赖,但由于没有关注初始图结构信息会丢失人体骨骼关节的固有连接信息。本文旨在提高基于骨架的动作识别的准确性。提出了一种基于Transformer架构的动作识别图骨架变压器网络(GSTN)来提取全局特征,同时使用对称矩阵表示的无向图信息来提取局部特征。特征处理中使用了两种编码来改进关节的语义和中心性特征。在多流融合策略的过程中,采用基于网格搜索的方法为每个输入流分配权重,以原创 2024-01-08 10:00:00 · 972 阅读 · 0 评论 -
2023(TranSkeleton):TranSkeleton: Hierarchical Spatial-Temporal Transformer for Skeleton-Based Action
存在问题:时间卷积很难有效地捕获远程依赖。同时,常用的多分支图卷积具有较高的复杂度。本文提出了 TranSkeleton,它统一了骨架序列的空间和时间建模。对于时间建模,本文提出了一种新颖的分区聚合时间 Transformer。它适用于分层时间的分区和聚合,可以有效地捕获远程依赖和微妙的时间结构。设计了一种差分感知聚合方法来减少时间聚合过程中的信息丢失。对于空间建模,本文提出了一种拓扑感知空间转换器,它利用人体拓扑的先验信息来促进空间相关性建模。原创 2024-01-05 09:30:00 · 891 阅读 · 0 评论 -
ICCV2021:AdaSGN: Adapting Joint Number and Model Size for Efficient Skeleton-Based Action Recognitio
现存问题:现有的基于骨架的动作识别方法主要集中在提高识别精度上,很少考虑模型的效率。本文提出了一种称为 AdaSGN 的新方法,该方法通过动态自适应地控制骨架关节的输入数量来降低推理过程的计算成本。此外,它还可以自适应地为每个样本选择最佳模型大小,以在准确性和效率之间实现更好的权衡。原创 2023-12-30 10:45:00 · 873 阅读 · 0 评论 -
2022CCIE (TSTE):Two-Stream Transformer Encoders for Skeleton-Based Action Recognition
本文提出了一种利用运动时空特征嵌入和形状变换的双流变压器编码器(TSTE)网络。每个流包含两个具有两个自注意力头的 Transformer 编码器层。形状转换逐帧重新排列特征。在 Transformer 架构之前引入了一个全连接层,以更密集地分配特征。为了扩展特征维度,两个流分别输入反映关节空间特征的坐标数据和反映运动时间特征的坐标变化。与现有方法相比,它可以将所有空间和时间特征作为一个整体来计算没有图拓扑或遍历规则的相关性。TSTE 网络的参数是一般图卷积方法的 30%。原创 2023-12-28 10:15:00 · 956 阅读 · 0 评论 -
2022(STTFormer):Spatio-Temporal Tuples Transformer for Skeleton-Based Action Recognition
现存问题:现有的基于 Transformer 的方法无法捕捉帧之间不同关节的相关性。针对这一问题,本文提出了一种新的时空元组变压器(STTFormer)方法。骨架序列分为几个不重叠的部分。每个部分称为“元组”,包含几个连续的帧。由于几个连续帧中的不同关节具有相关性,因此每个元组被展平成一个短序列。时空元组自我注意模块来捕获连续帧中不同关节之间的关系。此外,在非相邻帧之间引入了一个特征聚合模块,以增强区分相似动作的能力。原创 2023-12-26 10:30:00 · 1438 阅读 · 0 评论 -
2021CVIU(ST-TR):Skeleton-based Action Recognition via Spatial and Temporal Transformer Networks
本文提出了一种新颖的时空 Transformer 网络 (ST-TR),它使用 Transformer 自注意力算子对关节之间的依赖关系进行建模。在 ST-TR 模型中,空间自注意力模块 (SSA) 用于理解不同身体部位之间的帧内交互,并使用时间自注意力模块 (TSA) 来模拟帧间相关性。原创 2023-12-04 21:37:27 · 310 阅读 · 0 评论 -
2022CVPR(PoseC3D):Revisiting Skeleton-based Action Recognition
本文提出了一种新的基于骨架的动作识别方法PoseC3D,它**依赖于3D热图堆栈而不是图序列作为人体骨骼的基本表示**。与基于 GCN 的方法相比,PoseC3D 在学习时空特征方面更有效,对姿态估计噪声具有更强的鲁棒性,并且在跨数据集设置中更好地泛化。此外,PoseC3D可以处理多人场景,而不需要额外的计算成本,其特征在早期融合阶段可以很容易地与其他模式集成,这为进一步提高性能提供了很大的设计空间。原创 2023-12-03 16:50:31 · 1038 阅读 · 0 评论