Kinetics 数据库处理

本文仅为自己研究过程的一个随手记录,部分细节可能没有严格考证

kinetics数据库是当前较大规模的行为识别数据库,400类,training set 246k video, validation set 20k. 由于此前没有接触过视频数据库,而这个库又非常大,处理起来比较麻烦,记录一下。

  1. 下载
  2. mp4 -> jpg

下载

kinetics数据库的页面 , 里面没有现成的video,要根据提供的链接自己一个一个爬…好像看到有人说一个月也没爬多少。。不知真假。。。不过更严重的是里面部分链接已经被视频发布者删除或者转为私密模式了。non-local的作者Xiaolong Wang对kinetics短边按比例缩放到256保存了一个副本,github 链接 ,大约占132G, (原数据集400G+)云盘的下载链接要向他发邮件获取,由于图像大小有所损失,对data augmentation有影响,并且这个数据当时下载的时候大约有5%的video已经不存在了,所以性能会略有损失,(Xiaolong Wang:损失<0.5%)。132G的压缩包,下载速度10M/s,大约用了3.5h。

mp4 --> jpg

kinetics的视频都是mp4格式,non-local 貌似就直接用mp4格式输入网络(作者自述 我没有考证),但是non-local用的是caffe2,我不是很6,所以借助的是CVPR2018上的一篇3D conv的pytorch实现。这篇工作里将mp4处理成jpg进行训练,所以也按帧提取了一下。使用上述project中 utils/video_jpg_kinetics.py 实现。

该过程耗时近24h,读写均在ssd上,拆解成frame的文件所占空间为400G+

比较3D conv与non-local的设置差异

worktrain methodbackboneinputframes/clipdata format
non-localfine-tuneResNet50 + I3D224x22432mp4
3D ResNettrain from scratchResNet50 + 3D112 x 11216jpg

其中3D ResNet所用GPU为8*titanx。

  • 3
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 37
    评论
训练Kinetics代码是指开发和调整神经网络模型,以对视频数据集Kinetics进行训练,从而使该模型能够对视频进行分类、检测、分割等任务。下面是关于如何训练Kinetics代码的一些步骤和注意事项。 首先,需要准备好Kinetics数据集,该数据集包含了大量的视频片段,每个片段都有对应的标签,用于指示视频所属的类别。可以从Kinetics官方网站上下载数据集,并将其重新组织和标注。 接下来,需要选择合适的神经网络模型来训练Kinetics数据集。常用的选择包括2D卷积神经网络(CNN)、3D卷积神经网络(C3D)、I3D等。根据实际需求和计算资源情况,选择合适的模型进行实验。 在进行训练之前,需要将视频数据预处理成模型所需的输入格式。这可能包括将视频切分成帧、调整帧的大小和格式,以及提取光流等操作。可以使用OpenCV等库来实现这些预处理操作。 然后,需要定义模型的架构和损失函数。在Kinetics数据集上进行视频分类任务时,常用的损失函数包括交叉熵损失。还可以根据需要添加其他的损失函数,如区域损失(region loss)或时间一致性损失(temporal consistency loss)等。 接下来,需要定义优化器和学习率衰减策略。常用的优化器包括随机梯度下降(SGD)和Adam。学习率衰减策略有多种,如固定衰减、按步骤衰减或根据验证集性能动态调整等。根据实际情况选择适合的优化器和衰减策略。 最后,开始进行模型的训练。根据设置的超参数和训练集来训练时间可能会非常长,可能需要在多个GPU上进行分布式训练,以加快训练速度。还需要定期保存训练过程中的中间模型和日志信息,以便在训练过程中进行模型的验证和监控。 总之,训练Kinetics代码需要做好数据准备、选择适合的模型、预处理视频数据、定义模型架构和损失函数、设置优化器和学习率衰减策略,并进行耐心的训练过程。通过反复测试和调整超参数,不断优化模型的性能,最终可以得到较好的训练结果。
评论 37
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值