结合目标检测与多3DCNN的行为识别

该博客介绍了一种结合SSD目标检测和3DCNN的行为识别方法。首先,通过SSD检测人体并抠图,再训练两个3DCNN模型分别处理原始帧和crop图像。特征提取后进行融合,最后利用SVM进行分类。在KTH数据集上进行实验,结果显示融合特征的正确率为87.44%,优于单独使用原始帧或crop帧的特征。
摘要由CSDN通过智能技术生成

主要思路:利用SSD目标检测检测人体,并将人体图抠出来,然后对原始帧和人体crop图像分别训练一个3DCNN,然后把这两个3DCNN作为特征提取器,分别提取原始帧和crop帧的特征,接着将特征进行融合,最后用SVM进行分类。

代码地址:Multi-3DCNN-for-action-recognition

主要流程如下图所示:



使用的是kth数据集,这个程序目前只能用于kth数据集,因为kth数据集每个视频中只有一个人。

训练3DCNN的时候,数据集的划分如下:

每个动作是由25个人完成,与一般论文中对kth的处理一致,前16个人作为训练,后9个人作为测试。

提取特征进行svm分类时,训练集与测试集也是前16个人作为训练,后9个人作为测试。

从每个训练集中的视频随机取出四段连续的16帧视频作为训练样本,从每个测试集中的视频随机取出一段连续的16帧视频帧作为测试样本。

因此总训练样本数为 16x4x4x6 = 1536,测试样本为:9x4x1x6-1=215

具体细节可看代码中

评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值