视频分析模型(行为识别):C3D

C3D

1. 简介

论文:https://arxiv.org/abs/1412.0767v4

github

原代码:https://github.com/facebook/C3D

TensorFlow:https://github.com/hx173149/C3D-tensorflow

1.1 背景

卷积神经网络(CNN)被广泛应用于计算机视觉中,包括分类、检测、分割等任务。

这些任务一般都是针对图像进行的,使用的是二维卷积(即卷积核的维度为二维)。而对于基于视频分析的问题,2D convolution不能很好得捕获时序上的信息,因此3D卷积就被提出来了。

3D卷积 最早应该是在 《3D convolutional neural networks for human action recognition》 这片论文中被提出并用于行为识别的,而C3D是作为一个通用的网络提出的,论文中将其用于行为识别,场景识别,视频相似度分析等领域。

1.2 C3D特点
  1. 3D ConvNets比2D ConvNets更适用于时空特征的学习
  2. 对于3D ConvNet而言,在所有层使用3×3×3的小卷积核效果最好
  3. 通过简单的线性分类器学到的特征名为C3D(Convolutional 3D),在4个不同的任务和6个基准上表现优秀,在2015年达到SOTA
  4. 特征紧凑:在UCF101数据集上得到52.8%的准确率只用了10维(PCA+SVM)
  5. 推断快,计算效率非常高,在论文中实验时就有300帧以上的FPS,使用 NVIDIA 1080 GPU 能达到600帧以上
  6. 概念简单,易于训练和使用
1.3 视频描述符

一个有效的视频描述符有四个属性:

  1. 通用性。可以表示不同类型的视频,同时具有可区分性。例如,网络视频可以是自然风光、运动、电视节目、电影、宠物、食物等
  2. 描述符必须是紧凑的。由于我们需要处理数百万的视频,一个紧凑的描述符有助于处理,存储和检索任务,更具可扩展性;
  3. 计算高效。因为在现实世界中,每一分钟都需要处理成千上万的视频;
  4. 实现简单。不使用复杂的特征编码方法和分类器,一个好的描述符即使是一个简单的模型(如线性分类器)也能很好地工作。

而C3D是好的描述符:通用、紧凑、简单、高效

C3D描述符,就是C3D网络第一个全连接层(fc6)输出的特征经过L2标准化后的结果。

1.4 C3D的结果

  • 16
    点赞
  • 135
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
要进行行为识别C3D训练自己的数据集,首先需要进行以下步骤: 1. 准备数据集:根据您的需求,收集并准备合适的训练数据集。可以使用视频数据来进行训练,常见的视频行为识别数据库包括UCF101、HMDB-51、Something-Something V2、AVA v2.2、Kinetic-700等[2]。UCF101是分类任务,而AVA v2.2是检测任务。您可以选择合适的数据库或根据您的需求自行收集视频数据。 2. 数据预处理:对于C3D训练,需要对数据进行预处理。根据引用中提供的信息,UCF101数据集的视频文件已经按照类别存放于不同的文件夹下。您可以按照自己的数据集的组织方式进行调整。此外,还可以对视频进行剪辑、采样和调整分辨率等操作,以适应模型的输入要求。 3. 划分训练集和测试集:根据您的需要,将数据集划分为训练集和测试集。可以使用已有的数据集划分方式,例如UCF101数据集的trainlist和testlist文件,或者根据您的需求自行划分。 4. 准备标签文件:为训练数据集准备标签文件,标明每个视频的类别或动作。可以参考已有的标签文件,例如UCF101数据集的classInd.txt文件。 5. 配置环境:确保您已经正确配置了C3D行为识别模型的训练环境。这包括安装必要的依赖库和框架,并配置好GPU加速等。 6. 训练模型:使用C3D模型对准备好的数据集进行训练。可以根据已有的代码或框架进行训练,例如使用C3D模型在PyTorch框架下进行训练。您可以参考引用中提供的相关项目下载和复现的信息。 总结起来,要进行行为识别C3D训练自己的数据集,您需要准备合适的数据集,进行数据预处理,划分训练集和测试集,准备标签文件,配置环境,然后使用C3D模型对数据集进行训练。以上是一个基本的步骤,具体的实施细节还需根据您的具体需求和环境进行调整。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值