![](https://img-blog.csdnimg.cn/20201014180756926.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
动作识别论文
bo666666
一个脑子不灵光的想要好好学习的人
展开
-
Skeleton-Based Action Recognition with Spatial Reasoning and Temporal Stack Learning
参考博客 身体分为5块,每一块用全连接变成一个新的坐标,再送入残差图网络;红色的是每个节点的 信息,送入fc;再用双流网络来弄原创 2020-11-07 18:19:49 · 284 阅读 · 0 评论 -
An Attention Enhanced Graph Convolutional LSTM Network for Skeleton-Based Action Recognition
先把论文的框架放到这里,我再聊一下我觉得比较有意思的地方(如果有不对的地方请多多指教) 1.LSTM里用了图卷积(毕竟是骨架结构) 公式如下 2.LSTM里集成了注意力,而且这个最后输出是最后一行的Ht,fatt是注意力模型 注意力模型 3.骨架通过FC用n*256维的空间表示 4.FA负责找前后两帧的差异 5.LSTM层连接了FC与FA的内容(通过contact) 6.TAP:池化层,只不过是时间层面上的,减少计算量,使变化更明显 7.他的损失函数 第三项旨在关注不同的关节(这个有一点不懂)第四项旨原创 2020-10-17 15:48:51 · 167 阅读 · 0 评论 -
View Adaptive Neural Networks for High Performance Skeleton-based Human Action Recognition
这是一个论文的笔记 大致思路:对每一个动作视频选一个更好的角度进行旋转处理(这么理解,原来的数据集的摄像头的位置不咋地,导致数据集中的视频不咋地,而这篇论文做的就是给数据集中的每个视频自动找一个好的角度)然后送入主网络进行分类。 先通过view adaptation subnetwork 找到一个合适的角度,再变换,再分类 整个网络模型 如何进行变换 αt,βt,γt是沿X轴、Y轴和Z轴顺时针旋转的角度 v‘是旋转后的位置 LSTM如何找角度 hrt是LSTM隐式输出向量,Wr是全连接层的权重,br是全原创 2020-10-04 21:18:13 · 604 阅读 · 0 评论 -
ST-GCN
论文理解原创 2020-10-03 19:47:28 · 409 阅读 · 0 评论