![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
论文阅读
文章平均质量分 90
Mitsui745
这个作者很懒,什么都没留下…
展开
-
论文Is Space-Time Attention All You Need for Video Understanding?阅读笔记
写在前面:要从Transformer在NLP领域的一举成名说起,这种简单只使用注意力机制(attention)的结构在机器翻译等等方向都取得了不错的效果。顾名思义,这篇文章的方法基于Transformer提出了一种用于视频理解的框架,是Google提出的用于图像的Transformer-ViT(VisionTransformer)的扩展,将该方法命为TimeSformer(Time-Space Transformer)。对于基本的Transformer不再赘述,对...原创 2021-12-09 17:06:17 · 1125 阅读 · 0 评论 -
GNN综述:论文A Comprehensive Survey on Graph Neural Networks
目录一、什么是图神经网络二、图神经网络的种类1、图卷积网络(Graph Convolution Networks,GCN)2、图注意力网络(Graph Attention Networks)3、Graph Autoencoders4、Graph Generative Networks5、Graph Spatial-Temporal Networks三、图神经网络的应用一、什么是图神经网络 传统的深度学习方法被应用在提取欧氏空间数据的特征方面取得了巨大的成功...原创 2021-11-26 19:05:07 · 1969 阅读 · 0 评论 -
循环GCN相关
粗读几篇循环GCN有关论文,简单进行总结1.Understanding Human Gaze Communication by Spatio-Temporal Graph Reasoning提出了一个时空图神经网络来明确表示社交场景中不同的注视互动,并通过信息传递来推断原子水平的注视通信。我们进一步提出了一种具有编码解码器结构的事件网络来预测事件级的注视通信。对输入视频执行空间推理,通过消息传播更新节点标识。在c中,粗的箭头表示权重较高,具有视线的交互。通过输入的社交视频(a).原创 2021-11-05 19:24:04 · 228 阅读 · 0 评论 -
[论文阅读]Spatial Temporal Graph Convolutional Networks for Skeleton-Based ActionRecognition
目录一.概括二.传统GCN与本文ST-GCN之间的区别 三.实现ST-GCN的细节一.概括传统的a骨骼建模方法通常依靠手工制作部分或遍历规则,从而导致表达能力有限和泛化困难.过往方法能力的限制在于不能精确的提取关节之间的空间关系,而这些空间关系对于理解人类活动是重要的。本文旨在开发一种有原则的、有效的动态骨骼建模方法,并将其用于动作识别。提出了一种新的 ST-GCN,即时空图卷积网络模型,用于解决基于人体骨架关键点的人类动作识别问题。通过自动从数据中自动学习空间和时间...原创 2021-10-29 16:41:05 · 1627 阅读 · 0 评论