Kinetics 数据库处理

XiaoPangJix1

于 2019-01-19 22:36:58 发布

阅读量3.3k

点赞数 3

分类专栏： video 文章标签： kinetics video

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zmm__/article/details/86557921

版权

本文记录了Kinetics行为识别数据库的处理过程，包括mp4到jpg转换及与non-local设置差异对比，涉及数据下载、格式转换、3Dconv与non-local网络输入格式区别。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Kinetics 数据库处理

下载
mp4 --> jpg
比较3D conv与non-local的设置差异

本文仅为自己研究过程的一个随手记录，部分细节可能没有严格考证

kinetics数据库是当前较大规模的行为识别数据库，400类，training set 246k video, validation set 20k. 由于此前没有接触过视频数据库，而这个库又非常大，处理起来比较麻烦，记录一下。

下载
mp4 -> jpg

下载

kinetics数据库的页面 , 里面没有现成的video，要根据提供的链接自己一个一个爬…好像看到有人说一个月也没爬多少。。不知真假。。。不过更严重的是里面部分链接已经被视频发布者删除或者转为私密模式了。non-local的作者Xiaolong Wang对kinetics短边按比例缩放到256保存了一个副本，github 链接 ,大约占132G, （原数据集400G+）云盘的下载链接要向他发邮件获取，由于图像大小有所损失，对data augmentation有影响，并且这个数据当时下载的时候大约有5%的video已经不存在了，所以性能会略有损失，（Xiaolong Wang：损失<0.5%)。132G的压缩包，下载速度10M/s,大约用了3.5h。

mp4 --> jpg

最低0.47元/天解锁文章

评论 37

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。