论文阅读：View Adaptive Recurrent Neural Networks for High Performance Human Action Recognition from Skel

最新推荐文章于 2022-03-02 17:08:35 发布

小吴同学真棒

最新推荐文章于 2022-03-02 17:08:35 发布

阅读量302

点赞数

分类专栏：学习人工智能文章标签：骨架点动作识别动作识别骨架点计算机视觉视频动作识别

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_36627158/article/details/116208538

版权

学习同时被 2 个专栏收录

115 篇文章 7 订阅

订阅专栏

72 篇文章 5 订阅

订阅专栏

目录

视角变换的数学公式：

Proposed Method

论文名称：View Adaptive Recurrent Neural Networks for High Performance Human Action Recognition from Skeleton Data（2017 ICCV）

下载地址：https://arxiv.org/pdf/1703.08274.pdf

Motivation

采集骨架点的相机视角的不同和视频中的人做动作方向的不同给骨架点人体动作识别任务带来了一定困难。

之前大家解决这个困难的方法是：将视频中每一帧的骨架中心点数据放置于原点，并将骨架点数据绕原点进行旋转，使得身体平面平行于 xy 平面。

但这样会丢失身体的运动信息，包括运动轨迹、身体中心运动的速度和身体变化的方向，导致例如走路这个动作变为原地行走，跳舞这个动作变为朝着一个固定的方向进行等情况。

所以，作者提出了一个端到端训练的、自适应视角的骨架点人体动作识别框架。

Preliminaries

视角变换的数学公式：

其中， $v_{t, j}$ 指的是第 t 帧中的第 j 个节点的数据。 $d_{t}$ 是第 t 帧所有骨架点的位移参数。

$R_{t}$ 是第 t 帧所有骨架点的旋转参数。

Proposed Method

作者提出了一个端到端训练的、自适应视角的骨架点人体动作识别框架。

该框架包含两个部分：视角适应子网 和 主 LSTM 网络。

视角适应子网：用来自动学习两个参数，即视角变换数学公式中的两个参数：rotation（ $R_{t}$ ） 和 translation（ $d_{t}$ ），找到最适合对该段视频进行动作识别每一帧的视角。

再对每一帧的骨架点数据进行相同的视角变化。

主 LSTM 网络：对经过视角变化的骨架点数据进行动作识别。

端到端的训练主要体现在：通过主 LSTM 网络的动作识别的误差来调整视角适应子网的参数。

小吴同学真棒

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

小吴同学真棒 CSDN认证博客专家 CSDN认证企业博客

码龄8年

132: 原创

4万+: 周排名

1万+: 总排名

24万+: 访问

: 等级

2902: 积分

325: 粉丝

348: 获赞

271: 评论

1026: 收藏

私信

关注

热门文章

分类专栏

latex 1篇
学习 115篇
人工智能 72篇
日常学习 4篇
PyTorch 16篇
leetcode 1篇
c语言 25篇
英文学术论文写作 1篇
Python 8篇
环境配置 6篇
自律 1篇
Linux 1篇
tensorflow 3篇
PAT 15篇
Matlab 5篇
数据结构 1篇
开发 1篇
MAC 1篇

最新评论

Hi-TRS：骨架点视频序列的层级式建模及层级式自监督学习
weixin_51440200: 你好，想请问一下Discriminative Pretext task中的负样本是在论文和代码的哪里看出来的？
InstDisc 代码解读
diligent啊豆豆: 作者大大您好！我想请问一下这篇文章中用KNN做分类判定是怎么样做的呢？文中是说拿测试样本的特征向量与他之前训练集存储的特征向量之间做余弦相似度，然后再用KNN抽出附近K个特征向量s_i，求exp（s_i / t），然后做加权，但是我搞不懂他是怎么样分类的，难道他存储起来的训练集的特征向量是有标签的吗？
【论文阅读笔记】（2022 ECCV）CMD: Self-supervised 3D Action Representation Learning with Cross-modal Mutual Di
归昼: 从 B 模态的 Memory Bank 中找出和该特征向量最相近的 K 个特征向量，计算得到特征向量感觉不对，应该都是从A模态选取的，相当于anchor。如果每个都选取自己相近的那么这个KL散度就没意义了原文表述: we select the top K nearest neighbors of $z^a_k$ anchors and compute the similarity distributions
InstDisc 代码解读
qq_40819479: 您好您知道 loss中的nlem是什么吗
使用 PyTorch 框架复现 Two-Stream 网络过程中遇到的问题
Wyccc.: 我在执行和calOpticalFlow.m文件有关的代码时，报错matlab路径中未找到指定的文件名，多次修改后也无果，如果有解决办法还希望能帮助一下，谢谢！

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。