Two-Stream Convolutional Networks for Action Recognition in Videos

最新推荐文章于 2024-07-08 18:26:46 发布

Mr丶Caleb

最新推荐文章于 2024-07-08 18:26:46 发布

阅读量2.5k

点赞数

分类专栏： Paper reading

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_30159351/article/details/53693463

版权

Paper reading 专栏收录该内容

7 篇文章 0 订阅

订阅专栏

下载地址：http://www.datascienceassn.org/sites/default/files/Two-Stream%20Convolutional%20Networks%20for%20Action%20Recognition%20in%20Videos.pdf

What’s problem?

这篇论文主要是介绍了一种新的视频卷积的方法，并且将其应用于UCF-101和HMDB-51数据集中进行行为分类问题，取得了很好的效果。

What’s the challenges?

视频处理中，不但要考虑单帧的情况，也需要考虑各帧之前的相关性，即要处理空间和时间的信息。

What’s the STOA?

论文中提出了新的神经网络结构（双流卷积神经网络），其中一个网络处理静止图片的卷积，另一卷积网络处理光流图的卷积，然后对两个网络的分类结果加权融合，得到最终的分类结果。

What’s the proposed solution?

这里写图片描述

这里写图片描述

What’s the performance of the proposed solution?

这里写图片描述

Conclusion

这篇论文的主要贡献是：

提出了双流卷积的网络结构；
将静止帧和多帧的稠密光流分别卷积，从而分离了视频的空间和时间两个维度。
因为vggnet网络很深，所以需要的数据量很大，所以作者结合了两个数据集来训练网络，取得了结果的优化。

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。