【论文阅读】Skeleton Optical Spectra-Based Action Recognition Using Convolutional Neural Networks

最新推荐文章于 2022-04-08 16:46:06 发布

NRZZN

最新推荐文章于 2022-04-08 16:46:06 发布

阅读量431

点赞数

分类专栏：技术类

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zzmshuai/article/details/92016662

版权

技术类专栏收录该内容

28 篇文章 6 订阅

订阅专栏

【论文阅读】Skeleton Optical Spectra-Based Action Recognition Using Convolutional Neural Networks

这篇文章是基于正交时空编码图的方法，时空编码图使用的是HSV模型，其中色彩信息H用来编码骨骼的时空信息，饱和度S和亮度V用来编码骨骼关节点的运动速度信息，这篇文章的一些想法还是挺有意思的。

网络结构

在这里插入图片描述
整个网络结构如上图所示，对于一段骨骼序列，首先将其编码成正交时空编码图，然后将3个正交平面的时空编码图分别输入到卷积神经网络中，得到的预测结果融合得到最终的结果，主要介绍一下构建正交时空编码图的方法。

正交骨骼光谱图

因为需要将骨骼序列的时空信息都编码在正交骨骼光谱图中，正交骨骼光谱图是HSV模型，所以我们分别介绍：

编码骨骼的空间信息：编码骨骼空间时，首先在3个正交平面上分别累积骨骼点，这些点会保留人体骨骼的基本结构。
然后编码骨骼的运动信息，使用色彩H编码运动信息，和归一化很相似，只不过是沿着时间归一化。
然后为了加强空间信息，使之更容易分辨，将人体骨骼的左半部分按照【0-360】编码运动信息，将人体骨骼的右半部分按照【360-0】编码运动信息。将人体骨骼的脊柱不编码运动信息。
最后编码人体骨骼的速度信息，将速度信息编码到饱和度（S）和亮度（V）中，关节点的运动速度越快，饱和度和亮度就越大。

所以最终的彩色编码公式为：
在这里插入图片描述
其中H,S,V分别为色彩、饱和度和亮度的编码， $K_{1}$ 、 $K_{2}$ 、 $K_{3}$ 分别表示人体骨骼的3个部分（左半边身体、右半边身体和脊柱）。编码色彩的时候，左半边部分编码为【0-360】，右半边部分编码为【360-0】，脊柱不编码。编码饱和度时，只编码左右运动的速度，脊柱的运动速度因为噪声太大，不编码。编码亮度的时候左右部分编码为【0-1】，脊柱编码为【1-0】。

实验结果

在这里插入图片描述
实验结果如上表所示，可以看到每一步改进对最终的实验结果都是有益的。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。