《Beyond Short Snippets: Deep Networks for Video Classiﬁcation》解读

最新推荐文章于 2023-03-08 15:48:31 发布

uestcbyl

最新推荐文章于 2023-03-08 15:48:31 发布

阅读量358

点赞数

分类专栏：人群计数文章标签：异常检测 3D卷积

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/uestcbyl/article/details/102463776

版权

人群计数专栏收录该内容

6 篇文章 0 订阅

订阅专栏

创新点：
1、本文对两种长视频的处理方式进行了实验和比较，并在相关数据集上达到了很好的效果；
2、本文设计了5种conv方式，用于对时空信息的捕捉，并实验证明了哪种方式的最优；
3、本文用LSTMs捕捉长视频的信息；
学到的东西：
1、普遍的帧预测的方法为将视频信息看成静态图像，然后使用cnn来识别每一张照片，通过平均得到视频的分类；
2、较长帧对视频分类有好的作用，结合光流也有很好的信息；
3、3D卷积分类不好的原因有使用的帧过少的问题；
4、pooling layer 可以用于结合时间信息，如不同帧的照片，通过池化来结合，提取时空信息，通过平均池化、最大池化、时域池化、全连接代替池化，表明最大池化更好；
5、LSTM的四种模式的测试；
6、对长视频的光流处理方式：当以每秒采取一帧的情况下，光流的处理，靠[19]进行双流融合；2、先对原始图像进行训练，然后使用该参数对光流特征进行初始化训练效果更好；3、使用[26]的方法计算每秒采样1帧的情况下的光流的计算；
7、数据的处理方式：1、针对长视频，每秒采样1帧，采样多分钟；2、对于视频分钟数数目不足的，本文选择的方式是从头播放；3、图像大小处理，并通过随机反转来进行数据增强；4、groud truth使用帧平均；

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
《Beyond Short Snippets: Deep Networks for Video Classiﬁcation》解读

创新点：1、本文对两种长视频的处理方式进行了实验和比较，并在相关数据集上达到了很好的效果；2、本文设计了5种conv方式，用于对时空信息的捕捉，并实验证明了哪种方式的最优；3、本文用LSTMs捕捉长视频的信息；学到的东西：1、普遍的帧预测的方法为将视频信息看成静态图像，然后使用cnn来识别每一张照片，通过平均得到视频的分类；2、较长帧对视频分类有好的作用，结合光流也有很好的信息；3、...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。