论文笔记--Skeleton-Based Action Recognition with Multi-Stream Adaptive Graph Convolutional Networks

最新推荐文章于 2022-08-17 13:56:45 发布

Lyndsey

最新推荐文章于 2022-08-17 13:56:45 发布

阅读量908

点赞数 3

分类专栏： # 论文阅读笔记

本文链接：https://blog.csdn.net/hahameier/article/details/109537828

版权

本文探讨了多流自适应图卷积网络（AGCN）在骨骼动作识别中的改进，强调了自适应性在解决固定图结构问题中的作用，以及提出的注意力机制如何增强模型性能。研究通过端到端学习调整图的拓扑结构，结合关节和骨骼信息，实现了识别性能的提升，并在大规模数据集上得到验证。

摘要由CSDN通过智能技术生成

Hello，接下来的30天，我会坚持输出30篇论文笔记，有些论文会配上代码的理解。以输出的方式倒逼着自己去输入。

想做实验，但是脑袋空空如也，没有新的想法，这是大脑在提醒你该踏实去科研去看论文做实验；想写论文，逻辑不清此举匮乏，这是大脑在提醒你该多多看论文记录下那些好的词句；想写一些文字表达自己想法时，却不知如何下笔，这是在大脑在提醒自己该看书了。

这样的情形还有很多，但我想表达的并不是“你真懒”，“You are bad”或者其他负面的话语。我想说，我们要看清、认清这些时刻，然后对其作出自己的调整和改变即可。不要责备自己，接受自己，改进完善自己。

好啦好啦，鸡汤就到这里了。下面开始正式学习论文吧！
希望可以坚持做好这件事，因为我的目标是年底的时候总结一份根据自己论文阅读经验整合而成各个方向的大总结。我一定可以的！

一、论文题目关键词提取

Multi-Stream：多流。这里的多流指的是结合了joint 信息和bone信息，将其分别经过模型训练测试后，融合其结果。
Adaptive：自适应。这也是近两年听到的挺多的词，本文是根据网络结构中不同层的语义信息、不同样本的特点生成唯一的图结构，而不是一个固定的图结构。

二、研究背景

近几年随着越来越多生活场景中应用的需要，基于视频流的行为识别的研究不断激增，学者们的研究方法也迭代的十分迅速。从最初传统光流等的方法，再到基于深度学习的方法，方法处理的多样性，准确率提升的迅速性，都是大家有目共睹的。

在基于深度学习的方法中，从网络结构来看，我们又可以将其分为三类：基于RNN的，基于CNN的，以及基于GCN的。具体的大家可以去看一下行为识别的综述，我在日后写到这方面论文的时候也会提及一些。

本文最初的起源是来自于大家都知道的ST-GCN这篇论文，作者的第一版论文2s-AGCN先对其进行改进，增加了自适应的部分，还提出了结合bone信息。第二版论文，也就是本文的这篇，在第一版的基础上再次改进了自适应的部分，增加了门控机制，并且提出了空间、帧、特征的三个注意力机制。

三、研究内容 & 目标

（插曲：记得在我研一才进来的时候，我向师兄或者老师提问时，他们总会问我，别人这么做的目的是什么，为什么这么做？我回答最直接的就是提升准确率嘛。然后呢？然后然后。。。嗯。。。

直到最近，我感觉我才迷迷糊糊懵懵懂懂的领悟到那个目标是什么？为什么这么做？以及目标和内容之间的关系。（当然也可能是跟着我导写本子得来的经验总结吧）

目标也是目的，大的来说是准确率，小的来说是为了解决什么问题。比如本文的自适

最低0.47元/天解锁文章

Lyndsey

关注

3
点赞
踩
9

收藏

觉得还不错? 一键收藏
2
评论
论文笔记--Skeleton-Based Action Recognition with Multi-Stream Adaptive Graph Convolutional Networks

Hello，接下来的30天，我会坚持输出30篇论文笔记，有些论文会配上代码的理解。以输出的方式倒逼着自己去输入。想做实验，但是脑袋空空如也，没有新的想法，这是大脑在提醒你该踏实去科研去看论文做实验；想写论文，逻辑不清此举匮乏，这是大脑在提醒你该多多看论文记录下那些好的词句；想写一些文字表达自己想法时，却不知如何下笔，这是在大脑在提醒自己该看书了。这样的情形还有很多，但我想表达的并不是“你真懒”，“You are bad”或者其他负面的话语。我想说，我们要看清、认清这些时刻，然后对其作出自己的调整和改变即
复制链接

扫一扫

专栏目录