《Beyond Short Snippets: Deep Networks for Video Classification》解读

创新点:
1、本文对两种长视频的处理方式进行了实验和比较,并在相关数据集上达到了很好的效果;
2、本文设计了5种conv方式,用于对时空信息的捕捉,并实验证明了哪种方式的最优;
3、本文用LSTMs捕捉长视频的信息;
学到的东西:
1、普遍的帧预测的方法为将视频信息看成静态图像,然后使用cnn来识别每一张照片,通过平均得到视频的分类;
2、较长帧对视频分类有好的作用,结合光流也有很好的信息;
3、3D卷积分类不好的原因有使用的帧过少的问题;
4、pooling layer 可以用于结合时间信息,如不同帧的照片,通过池化来结合,提取时空信息,通过平均池化、最大池化、时域池化、全连接代替池化,表明最大池化更好;
5、LSTM的四种模式的测试;
6、对长视频的光流处理方式:当以每秒采取一帧的情况下,光流的处理,靠[19]进行双流融合;2、先对原始图像进行训练,然后使用该参数对光流特征进行初始化训练效果更好;3、使用[26]的方法计算每秒采样1帧的情况下的光流的计算;
7、数据的处理方式:1、针对长视频,每秒采样1帧,采样多分钟;2、对于视频分钟数数目不足的,本文选择的方式是从头播放;3、图像大小处理,并通过随机反转来进行数据增强;4、groud truth使用帧平均;

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值