结合目标检测与多3DCNN的行为识别

Atwood_song

于 2018-01-08 13:43:38 发布

阅读量7.4k

点赞数 1

分类专栏： DL&ML相关文章标签：深度学习 python 行为识别 3DCNN

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Atwood_song/article/details/79001966

版权

该博客介绍了一种结合SSD目标检测和3DCNN的行为识别方法。首先，通过SSD检测人体并抠图，再训练两个3DCNN模型分别处理原始帧和crop图像。特征提取后进行融合，最后利用SVM进行分类。在KTH数据集上进行实验，结果显示融合特征的正确率为87.44%，优于单独使用原始帧或crop帧的特征。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

主要思路：利用SSD目标检测检测人体，并将人体图抠出来，然后对原始帧和人体crop图像分别训练一个3DCNN，然后把这两个3DCNN作为特征提取器，分别提取原始帧和crop帧的特征，接着将特征进行融合，最后用SVM进行分类。

代码地址：Multi-3DCNN-for-action-recognition

主要流程如下图所示：

使用的是kth数据集，这个程序目前只能用于kth数据集，因为kth数据集每个视频中只有一个人。

训练3DCNN的时候，数据集的划分如下：

每个动作是由25个人完成，与一般论文中对kth的处理一致，前16个人作为训练，后9个人作为测试。

提取特征进行svm分类时，训练集与测试集也是前16个人作为训练，后9个人作为测试。

从每个训练集中的视频随机取出四段连续的16帧视频作为训练样本，从每个测试集中的视频随机取出一段连续的16帧视频帧作为测试样本。

因此总训练样本数为 16x4x4x6 = 1536，测试样本为：9x4x1x6-1=215

具体细节可看代码中

最低0.47元/天解锁文章

评论 5

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。