无敌小枫枫-CSDN博客

原创 Br-Prompt中的fusion module

基于提示的推理：在自然语言处理领域中，“预训练、提示和预测”范式表明，基于提示的设计具有将下游任务的目标与预训练过程相结合的优势。首先，找到与融合模块输出的x[:, :, 0]（即connt信息）最匹配的统计提示嵌入，以确定动作的总数。帧级特征（代码中为x）与序数提示嵌入一同经过融合编码器，提取第i个动作的clip级特征代码中的x[:, :, -self.clip_length:]。此外，我们添加了一个可学习的计数标记（代码中的self.cnt_token），以学习额外的动作定量信息。

2023-08-25 22:38:08 184

原创近期arxiv上使用diffusion的行为识别、动作生成等论文

与先前的视频变换器不同，它们使用相同的静态嵌入作为类令牌，适用于多样化的输入，我们提出了一个动态类令牌生成器，通过分析手物交互和相关的运动信息，为每个输入视频生成一个类令牌。我们在视频生成、预测和动力学建模（例如基于物理的问答）任务上进行了广泛的实验，以展示VDT在各种场景下的有效性，包括自动驾驶、人体动作和基于物理的模拟。我们对三个基准数据集（即GTEA、50Salads和Breakfast）进行了广泛的实验，所提出的方法在结果上优于或与最先进的方法相当，显示了用于动作分割的生成方法的有效性。

2023-08-16 16:37:49 449

原创近期arxiv上的使用prompt的行为识别、动作生成等论文

Seeing in Flowing: Adapting CLIP for Action Recognition with Motion Prompts LearningThe Contrastive Language-Image Pre-training (CLIP) has recently shown remarkable generalization on "zero-shot" training and has applied to many downstream tasks. We explo

2023-08-13 00:37:40 590

翻译 G-TAD（G-TAD: Sub-Graph Localization for Temporal Action Detection）论文代码01

G-TAD论文G-TAD数据输入gtad-postprocess.py动作分类实现细节实验对比GTAD论文实验AGT论文实验P-GCN论文实验导出与导入导出导入导出与导入导出导入G-TAD数据输入class VideoDataSet(data.Dataset): # thumos def __init__(self, opt, subset="train", mode="train"): self.temporal_scale = opt["temporal_scale"]

2021-05-22 17:21:10 503 2

翻译 P-GCN（Graph Convolutional Networks for Temporal Action Localization）01

P-GCN之前一直在看G-TAD的论文和代码，突然发现实验结果的地方，加了P-GCN。P-GCN结果真的强。代码地址：https://github.com/Alvin-Zeng/PGCN摘要部分大多数最先进的动作本地化系统都单独处理每个动作建议，而在学习过程中没有明确利用它们之间的关系。但是，提案之间的关系实际上在动作本地化中起着重要作用，因为有意义的动作始终在视频中包含多个提案。在本文中，我们建议使用图卷积网络（GCN）开发提案-提案关系。首先，我们构造一个行动建议图，其中每个建议都表示为一个节点

2021-05-22 17:18:36 794

原创论文笔记：Dynamic GCN: Context-enriched Topology Learning for Skeleton-based Action Recognition

原论文：Dynamic GCN: Context-enriched Topology Learning for Skeleton-based Action Recognition（暂未开源）Dynamic GCN：基于骨架的动作识别的上下文丰富的拓扑学习图卷积网络（GCN）对基于骨架的动作识别任务越来越感兴趣。关键在于图形结构的设计，该结构对骨架拓扑信息进行编码。在本文中，提出了Dynamic GCN，其中引入了一种新的卷积神经网络，称为上下文编码网络（CeN），以自动学习骨架拓扑。特别是，在学习两

2020-08-05 23:11:13 1786

原创论文笔记：Temporal Complementary Learning for Video Person Re-Identification（TCLNet）用于视频行人重识别的时序互补学习

github代码地址：https://github.com/blue-blue272/VideoReID-TCLNet作者团队：中科院&国科大摘要：本文提出了一种时序互补学习(Temporal Complementary Learning)网络，该网络提取连续视频帧的互补特征以进行视频中的行人重识别。首先，我们介绍了一个时序显著性擦除（TSE）模块，其中包括显著性擦除操作和一系列有序学习器。具体地，对于视频的特定帧，显著性擦除操作通过擦除由先前帧激活的部分来驱动特定学习者挖掘新的和互补的部

2020-08-04 19:25:32 1446

原创从头开始安装python环境和pytorch等

参考资料：查看cuda版本：https://www.jianshu.com/p/d3b9419a0f89将anaconda安装到pycharm中：https://blog.csdn.net/weixin_38881822/article/details/89787343安装pytorch：https://blog.csdn.net/jieshaoxiansen/article/details...

2020-03-03 00:47:14 410

原创安装demjson

安装demjson项目描述“demjson”模块和包含的“isonlint”脚本提供了对JSON格式数据进行编码和解码的方法，以及检查JSON数据的错误和/或可移植性问题。jsonlint命令/脚本可以在命令行中使用，而不需要任何编程。尽管标准的Python库现在包含基本的JSON支持(在demjson首次编写时它并没有支持)，但是这个模块提供了一个更全面的实现，有许多其他地方没有的特性。对于...

2018-11-07 10:27:17 1275

原创 EndNote初学

EndNote初学文献数据库的使用文件->新建->修改文献数据库的名字创建条目包含的基本要素：作者，年份，标题，期刊，卷，页码，期，数字对象识别码。注意：在endnote下不要注意的是：1.作者的写法，缩写要不要加“.”等，两者之间要不要加句号2.期刊要不要加斜体还是粗体3.期刊要不要粗体这些都不要考虑，标准化输入，个性化输出。手动输入添加：对于字体...

2018-11-05 10:12:54 459

原创 ALexNet与VGG16初学总结

ALexNet与VGG16初学总结Alexnet（一）创新点：1.成功使用ReLU作为CNN的激活函数，并验证其效果在较深的网络超过了Sigmoid，成功解决了Sigmoid在网络较深时的梯度弥散问题。2.训练时使用Dropout随机忽略一部分神经元，以避免模型过拟合。3.在CNN中使用重叠的最大池化。此前CNN中普遍使用平均池化，AlexNet全部使用最大池化，避免平均池化的模糊化效果...

2018-10-28 15:19:05 3810

weixin_43179737的博客