论文笔记--Skeleton-Based Action Recognition with Multi-Stream Adaptive Graph Convolutional Networks

Hello,接下来的30天,我会坚持输出30篇论文笔记,有些论文会配上代码的理解。以输出的方式倒逼着自己去输入。

想做实验,但是脑袋空空如也,没有新的想法,这是大脑在提醒你该踏实去科研去看论文做实验;想写论文,逻辑不清此举匮乏,这是大脑在提醒你该多多看论文记录下那些好的词句;想写一些文字表达自己想法时,却不知如何下笔,这是在大脑在提醒自己该看书了。

这样的情形还有很多,但我想表达的并不是“你真懒”,“You are bad”或者其他负面的话语。我想说,我们要看清、认清这些时刻,然后对其作出自己的调整和改变即可。不要责备自己,接受自己,改进完善自己。

好啦好啦,鸡汤就到这里了。下面开始正式学习论文吧!
希望可以坚持做好这件事,因为我的目标是年底的时候总结一份根据自己论文阅读经验整合而成各个方向的大总结。我一定可以的!

一、论文题目关键词提取

  • Multi-Stream:多流 。这里的多流指的是结合了joint 信息和bone信息,将其分别经过模型训练测试后,融合其结果。
  • Adaptive: 自适应。这也是近两年听到的挺多的词,本文是根据网络结构中不同层的语义信息、不同样本的特点生成唯一的图结构,而不是一个固定的图结构。

二、研究背景

近几年随着越来越多生活场景中应用的需要,基于视频流的行为识别的研究不断激增,学者们的研究方法也迭代的十分迅速。从最初传统光流等的方法,再到基于深度学习的方法,方法处理的多样性,准确率提升的迅速性,都是大家有目共睹的。

在基于深度学习的方法中,从网络结构来看,我们又可以将其分为三类:基于RNN的,基于CNN的,以及基于GCN的。具体的大家可以去看一下行为识别的综述,我在日后写到这方面论文的时候也会提及一些。

本文最初的起源是来自于大家都知道的ST-GCN这篇论文,作者的第一版论文2s-AGCN先对其进行改进,增加了自适应的部分,还提出了结合bone信息。第二版论文,也就是本文的这篇,在第一版的基础上再次改进了自适应的部分,增加了门控机制,并且提出了空间、帧、特征的三个注意力机制

三、研究内容 & 目标

(插曲:记得在我研一才进来的时候,我向师兄或者老师提问时,他们总会问我,别人这么做的目的是什么,为什么这么做?我回答最直接的就是提升准确率嘛。然后呢?然后然后。。。嗯。。。

直到最近,我感觉我才迷迷糊糊懵懵懂懂的领悟到那个目标是什么?为什么这么做?以及目标和内容之间的关系。(当然也可能是跟着我导写本子得来的经验总结吧)

目标也是目的,大的来说是准确率,小的来说是为了解决什么问题。比如本文的自适应就是为了解决ST-GCN中固定图的问题,使其更灵活。

  • 3
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值