Quo Vadis, Action Recognition? A New Model and the Kinetics Dataset

时光荏苒,岁月如梭,恍惚间,一道白光闪现,空中一尊大佛低声喃语:小伙子,你,是不是太久没读论文了!于是,我开始补论文。简略记下,防止忘掉。

本文是deepmind出品,目的,就一个,放出个关于视频方面的训练集kinetics,一个四百个类,每个类有至少四百个clips,每个clips十秒钟,属于从youtube上剪切的视频,然后对比了几种现在存在的用于行为识别的几种框架,具体如下图:
这里写图片描述

其中,a,b,c,d是现有的做法,作者提出了e,唉,这种框架 ,感觉有点和前面没啥区别。然后,神奇的事情出现了:这个数据集上训练的模型,通过迁移学习到UCF101和HMDB51上,准确率惊人。
具体的网络:
这里写图片描述
这里写图片描述
做了如下几个事情:
第一:卷积核和pooling的核由二维扩展到三维。
第二:大的数据视频数据集上训练。
第三:迁移到UCF101,HMDB51,识别结果好。
实验结果:
这里写图片描述
是不是很惊喜,是不是,是不是,你收集的数据集,当然你说了算。

  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值