![21c8214e90f38608beec8f2d9e4256d5.png](https://i-blog.csdnimg.cn/blog_migrate/6dadfc43b933f5bb6f0ed5926f2ef2e0.jpeg)
我把我看过的一些中文记录下来,这个方向中文的论文并不多。我只看基于深度学习的,15年之前基于傅里叶时间金字塔和隐马尔可夫模型的研究意义不大了,中文要相对英文有一定延迟,所以最好是看18年之后的论文。
- [Res-STGCN]基于残差时空图卷积网络的3D人体行为识别(计算机应用与软件 2020)
Link:基于残差时空图卷积网络的3D人体行为识别 - 中国知网
Notes:
这篇论文是基于ST-GCN的,在此基础上加上了几层残差网络。我们关心的残差网络介绍的实在太少,只是画了两个图。就是两个STGCN卷积层加一个残差模块形成一个Res-STGCN块,而每个Res-STGCN块也加了残差模块,叠加几层就形成了整个网络。综合来说大部分原理就是ST-GCN这篇论文,其他就是残差网络。最后数据集用的是NTU RGB+D,代码应该是基于ST-GCN的,最后准确率对比只是和ST-GCN对比,后面对此进行的改进也没提到。总的来说这篇论文很一般,残差网路其实已经很难当创新点了,因为很多论文都用到了,但是只是当做实验处理的一个细节,很少拿出来当创新点的。
- 多尺度方法结合卷积神经网络的行为识别(计算机工程与应用 2018)
Link:多尺度方法结合卷积神经网络的行为识别 - 中国知网
Notes:
这篇文章是将多尺度思想和卷积神经网络结合的一种方法,用到的还是卷积神经网络,所以思想也是将骨骼数据编码成RGB数据,多尺度是针对于卷积核。原理很简单,但是一些细节是值得拿出来说一下的。对于很多CNN的方法,都是将骨骼数据编码成
- 基于CNN与双向LSTM的行为识别算法(计算机工程与设计 2020)
Link:基于CNN与双向LSTM的行为识别算法 - 中国知网
Notes:
这篇文章是用CNN和双向LSTM结合做的骨骼行为识别,CNN用于提取空间特征,双向LSTM用于提取时间特征。原理很简单,我大概看了一下他的细节,因为之前看过不少用CNN做的文章,所以需要CNN我就必看他关于数据处理的操作。既然是CNN,肯定是将骨骼数据编码成RGB数据,关于长宽不一致和帧数不同的问题,文章并没有像我看的上一篇文章那样把长宽非要做成一致的,事实上长宽不一致也是可以卷积的。不同序列采样相同的帧数,文章尝试了三种不同的帧数,最后是
我看他的一些网络参数是有些问题的,他说输入数据是
- 多流卷积神经网络的骨架行为识别(小型微型计算机系统 2020)
Link:多流卷积神经网络的骨架行为识别
Notes:
这篇文章是一种多流CNN处理再融合的方法。既然说多流,我们来看看是哪几种流,第一流是普通关节信息,这个不用多说;第二流是时域差分(同关节相邻帧的差),也就是之前文章提到的运动信息,这个也经常见到;第三流是空域差分(同帧不同关节的差),这就是两个关节点组成的边啊,图卷积都有的。这么说就说完了,其实这篇文章几乎和HCN方法一模一样,唯一不同的是,相对于HCN,这篇文章加了两两关节的差。有兴趣可以看下我之前博客对HCN的介绍,两篇文章的图几乎一摸一样,卷积层的参数设置的也相同。只不过这篇文章对转换维度没有过多解释,其实这是CNN的一大亮点。最后也是用的NTU RGB+D的数据集,从效果看,也和HCN相当。
- 多模态轻量级图卷积人体骨架行为识别方法(计算机科学与探索 2020)
Link:多模态轻量级图卷积人体骨架行为识别方法 - 中国知网
Notes:
这篇文章是我们学校人工智能与计算机学院发表的。主框架是基于SGN的,SGN是2020年的一篇顶会。文章是在SGN的基础上加上了一个多模态数据融合和对空间域和时间域分别加入了密集连接网络(DenseNet)。这里的多模态数据融合跟RA-GCN对数据预处理基本上方法是一样的,只不过这篇文章用的特征更多,就是包括:关节点、骨骼边长度、帧差、速度差和速度差长度。这里速度差是指相邻