![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
视频理解
X.mw
这个作者很懒,什么都没留下…
展开
-
论文阅读 -- 时序动作提名--CTAP: Complementary Temporal Action Proposal Generation
CTAP: Complementary Temporal Action Proposal Generation1. 前言时序动作提名生成的方法大致可以分为三类,基于滑动窗口的(SCNN-prop ,TURN),基于动作性分数判定的(TAG,BSN),将前两者的融合(CTAP,BMN,DBG)。这篇文章是第三种方法的最早的几篇论文了。基于滑动窗口的方法,将视频按照不同尺度划分为一系列窗口,再...原创 2020-04-18 16:35:44 · 948 阅读 · 1 评论 -
video analysis -- 弱监督的动作检测-UntrimmedNets
首先说一下什么是基于弱监督的动作检测,下图是一个视频的标注信息,包含动作类别和每个动作发生的时间信息。强监督就是利用所有信息对视频进行动作识别和定位;而弱监督是单单利用动作类别的信息进行训练,不使用动作时间段的标注。这篇文章是一篇很经典的基于弱监督动作检测的论文,现在的很多方法也是由此发展而来的。简单来说的,作者作者提出了两个模型:分类模型和选择模型来分别实现动作分类和动作定位。这俩模型都是...原创 2020-04-15 17:44:47 · 1262 阅读 · 0 评论 -
video analysis -- 时序动作提名-BMN
本文的主要贡献是通过引入一种全新的时序提名评估机制以及高效的特征采样方式,来提升了BSN方法的性能和效率这篇论文中提出了一种新的时序提名置信度评估机制-边界匹配机制(Boundary-Matching mechanism, BM mechanism),以及基于边界匹配机制的边界匹配网络(Boundary-Matching Network, BMN)。BMN网络能够同时生成与BSN中类似的一维边...原创 2020-04-11 12:18:46 · 1184 阅读 · 0 评论 -
video analysis -- 时序动作提名-BSN
BSN: Boundary Sensitive Network for Temporal Action Proposal Generation林天威大神的作品。https://zhuanlan.zhihu.com/p/39327364高质量的时序动作提名应该具备几点特质:(1)灵活的时序长度(2)精确的时序边界(3)可靠的置信度分数。现有的基于滑窗或anchor的方法或是基于聚类的方法...原创 2020-04-11 11:51:35 · 1684 阅读 · 0 评论 -
video analysis -- Temporal Action Proposal任务--评估指标
对于检测而言可以分为以下四种情况:True positives(TP): 被正确地划分为正例的个数,即实际为正例且被分类器划分为正例的实例数;False positives(FP): 被错误地划分为正例的个数,即实际为负例但被分类器划分为正例的实例数;False negatives(FN): 被错误地划分为负例的个数,即实际为正例但被分类器划分为负例的实例数;True negati...原创 2020-03-27 21:58:09 · 1505 阅读 · 0 评论 -
video analysis 论文阅读 P-GCN
Graph Convolutional Networks for Temporal Action Localization作者从proposal之间的关系出发,首先构造一个action proposal图(将proposal作为节点,proposal之间的关系作为边),文中构造了两种边contextual edges和surrounding edges分别用于“提取上下文信息”和“描述不同ac...原创 2020-03-22 09:47:21 · 645 阅读 · 0 评论 -
video analysis 论文阅读-SSN
Temporal Action Detection with Structured Segment Networks首先文章待解决的问题:1、以端到端的方式很难解决长的视频2、之前的方法既没有提供动作中不同阶段(例如开始和结束)的显式建模,也没有提供评估动作完整性的机制。文章是结合了延续了TSN的主要方法(稀疏采样),使用proposal+分类的模式,但是在时间维度显式建模,引入s...原创 2020-03-09 17:10:37 · 1173 阅读 · 0 评论 -
video analysis 论文阅读-TSN
Temporal Segment Networks: Towards Good Practices for Deep Action Recognition本文延续了双流网络,并考虑到计算花费改善了视频输入形式,提出了新的网络TSN,并且探索了一些实践方法(数据扩充,光流输入其他形式)。虽然文章比较老,但是实验过程以及对数据的处理值得参考。论文主要贡献:提出了TSN(Temporal Segme...原创 2020-03-06 09:59:21 · 456 阅读 · 0 评论 -
video analysis 论文阅读-Two-stream网络
Two-Stream Convolutional Networks for Action Recognition in Videos将单帧的图像信息和帧与帧之间的变化信息进行融合,单帧的图像可以形成对空间的描述,而通过光流法等方法形成的时间的描述(差分),从而达到时间和空间互补的目的。而本篇文章重点在讲述光流部分,考虑了几种不同的基于光流的输入。Two-stream architectur...原创 2020-03-06 09:43:41 · 511 阅读 · 0 评论