[行为识别]RPAN：An end-to-end recurrent pose-attention network for action recognition

最新推荐文章于 2023-04-12 23:06:23 发布

背包_十年

最新推荐文章于 2023-04-12 23:06:23 发布

阅读量3.8k

点赞数

分类专栏： faicutly 计算机视觉文章标签：计算机视觉深度学习行为识别

本文链接：https://blog.csdn.net/neu_chenguangq/article/details/79164830

版权

这篇文章是来自中科院深圳先进院乔宇老师，ICCV2017年的oral文章《RPAN：An End-to-End Recurrent Pose-Attention Network for Action Recognition in Videos》。这篇文章的出发点是当前行为识别的一大流行方向：RNN。与之前的video-level category 训练RNN不相同。这篇文章提出了引入pose-attention的RNN。文章总结共有以下几个贡献点：

不同于之前的pose-related action recognition，这篇文章是端到端的RNN，而且是spatial-temporal evolutionos of human pose
不同于独立的学习关节点特征(human-joint features)，这篇文章引入的pose-attention机制通过不同语义相关的关节点(semantically-related human joints)分享attention参数，然后将这些通过human-part pooling层联合起来
视频姿态估计，通过文章的方法可以给视频进行粗糙的姿态标记。(这个方法还挺不错)。

一、网络结构

整个网络框架可以分成三个大的部分：

特征生成部分：Conv Feature cube from CNN
姿态注意机制：Pose-Attention Mechanism
LSTM：RNN网

下面是整体网络结构图。

这里写图片描述

1.1 Convolut

最低0.47元/天解锁文章

背包_十年

关注

0
点赞
踩
10

收藏

觉得还不错? 一键收藏
2
评论
[行为识别]RPAN：An end-to-end recurrent pose-attention network for action recognition

这篇文章是来自中科院深圳先进院乔宇老师，ICCV2017年的oral文章《RPAN：An End-to-End Recurrent Pose-Attention Network for Action Recognition in Videos》。这篇文章的出发点是当前行为识别的一大流行方向：RNN。与之前的video-level category 训练RNN不相同。这篇文章提出了引入pose-at...
复制链接

扫一扫