![](https://img-blog.csdnimg.cn/20201014180756754.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
视频行为识别
超级无敌陈大佬的跟班
站在巨人的肩膀上看星星.
不辜负每个朝阳,不荒废每个深夜,因平凡而奋斗,因奋斗而不平凡
展开
-
【视频行为识别6】TSN(Temporal Segment Network—ECCV2016
TSN(Temporal Segment Networks)论文:Temporal Segment Networks: Towards Good Practices for Deep Action Recognition论文链接:https://arxiv.org/abs/1608.00859代码链接一(caffe):https://github.com/yjxiong/tempora...原创 2020-03-16 16:00:23 · 4027 阅读 · 3 评论 -
【视频行为识别8】SlowFast Networks for Video Recognition快慢双通道网络(CVPR2019)
Slow:其中一个路径旨在捕获由图像或稀疏帧提供的语义信息,它以低帧率运行,刷新速度慢。Fast:另一个路径用于捕获快速变化的动作,它的刷新速度快、时间分辨率高。占总计算开销的20%左右。第二个路径通道较少。二者通过横向连接(lateral connection)进行融合。图1 SlowFast 网络包括低帧率、低时间分辨率的 Slow 路径和高帧率、高时间分辨率(Slow 路径时...原创 2020-03-14 17:31:16 · 3966 阅读 · 1 评论 -
【视频行为识别4】I3D:Two-Stream Inflated 3D ConvNets —CVPR2017
Two-Stream Inflated 3D ConvNets (I3D):文章提出了一种I3D(Two-Stream Inflated 3D ConvNets)模型,该3DCNN模型是由2DCNN Inception-V1扩张而来,并且可以使用在ImageNet上预训练的参数,实验结果表明这个模型在各个标准数据集上都取得了当时最好的结果。Inflated“就说明这是一种将2DC...原创 2020-03-14 17:22:18 · 4803 阅读 · 2 评论 -
【视频行为识别2】3D Convolutional Neural Networks for Human Action Recognition(2010年)3D卷积神经网络在人体动作识别中的应用
3D Convolutional Neural Networks for Human Action Recognition一个卷积map的某一位置的值是通过卷积上一层的三个连续的帧的同一个位置的局部感受野得到的。3D CNN架构包含一个硬连线hardwired层、3个卷积层、2个下采样层和一个全连接层。每个3D卷积核卷积的立方体是连续7帧,每帧patch大小是60x40;1)应...原创 2020-03-14 17:19:49 · 1300 阅读 · 0 评论 -
【视频行为识别3】C3D:使用3D卷积网络学习时空特征(2015)
3D卷积和池化观点:1)只有3D卷积才能保留输入信号的时间信息,相同的现象适用于2D和3D池化.2)虽然以前一些时间流网络采用多个帧作为输入,但是由于2D卷积,在第一卷积层之后,时间信息完全消失了。·3D ConvNets比2D ConvNets更适用于时空特征的学习;·对于3D ConvNet而言,在所有层使用3×3×3的小卷积核效果最好;网络的输入输出输...原创 2020-03-14 17:17:51 · 3086 阅读 · 3 评论 -
【视频行为识别7】ECO:Efficient Convolutional Network for Online Video Understanding(ECCV2018)
提出问题:1. 大部分推理均是局部(如取2s一段的子片段)进行的,丧失了跨越数秒的动作内的重要关系。2. 尽管有快速桢处理的局部方法,整个视频的处理效率不高,有损在线长视频分类检索的效率。本文:引入一种网络结构(考虑进了长视频和短视频,同时能使快速实现每个视频(per-video)的处理),该结构基于融合网络中的长时间内容,而不是像之前论文中先将视频分n个片段,然后网络分别处理每个片段...原创 2020-03-14 17:04:56 · 924 阅读 · 0 评论 -
【视频行为识别5】(双流网络)Two-stream Convolution Networks for Action Recognition in Videos(2014)
Two-stream Convolution Networks for Action Recognition in Videos论文链接:Two-Stream Convolutional Networks for Action Recognition in Videos主要贡献: (1)提出基于two-stream结构的CNN,由空间和时间两个维度的网络组成。(2)验证了即使在较小...原创 2020-03-29 16:53:15 · 4206 阅读 · 2 评论 -
【视频行为识别0】传统方法:Dense Trajectories(DT)和Improved Dense Trajectories(IDT)算法(ICCV2013)
DT算法论文:"Dense Trajectories and Motion Boundary Descriptors for Action Recognition"iDT算法论文:"Action Recognition with Improved Trajectories"一.Dense Trajectories(DT)算法介绍0、DT(Dense Trajectories)方法步骤:...原创 2020-03-31 17:06:44 · 2831 阅读 · 1 评论