视频理解
视频相关
陈生~
这个作者很懒,什么都没留下…
展开
-
【行为识别】TSN/TRN/TSM/SlowFast/Non-local
前言记录视频理解领域的几篇文章吧,由于每篇值得记录的东西不多,所以合在一起。关于开源框架,目前已知的有Facebook的SlowFast和商汤的X-Temporal,有设备的就尽量多跑跑模型吧视频相对于静态图像多了时间维度。静态图像的分类、检测、分割做得相对完善了,视频方面的工作想有创新必须在时间这个维度上钻研。预备知识时空卷积文章标题:A Closer Look at Spatiotemporal Convolutions for Action Recognition首先探讨一下几种形式的原创 2020-05-24 14:33:24 · 6387 阅读 · 0 评论 -
【视频检测】Flow-Guided Feature Aggregation for Video Object Detection
文章来源: Flow-Guided Feature Aggregation for Video Object DetectionIntroductionFGFA 是Deep Feature Flow的拓展工作。其主要思路是通过光流融合相邻帧的特征图来增强本征的特征。DFF为了提升速度而牺牲精度,而FGFA为了精度而牺牲速度。Network Architecture图中左右间隔K=10,聚合长度为2K+1=21. 当前帧(第t帧)由于运动模糊等原因导致特征图原本有目标的部分没有响应,但相邻帧(第.原创 2020-05-20 19:09:36 · 569 阅读 · 0 评论 -
【视频检测】FlowNet: Learning Optical Flow with Convolutional Networks
文章来源:https://arxiv.org/pdf/1504.06852.pdfNetwork Architecture作者从两个思路来设计网络,一种是更为通用的(这个网络用于其他领域比如语义分割也行),将两张图像拼接到一起(concate)作为输入,经由单个网络输出,名为FlowNetSimple;另一种能体现出计算Optical Flow 的特点(即计算两张图像的变化),作两路输入提取到两路特征图,之后再做进一步的操作,名为FlowNetCorr。FlowNetCorr这部分引用 ht.原创 2020-05-20 13:29:56 · 230 阅读 · 0 评论 -
【视频检测】Deep Feature Flow for Video Recognition
文章来源:https://arxiv.org/pdf/1611.07715.pdfIntroduction提出了DeepFeatureFlow Network,通过流场将深度特征从关键帧映射到其他帧,这样就节省了其他帧计算深度特征的时间。因为计算流场的时间相较而言很短,所以能够提高效率。Related WorkSlow Feature Analysis研究发现高级语义特征(深层特征)在帧间的变化慢于低级的语义特征(原图或浅层特征)。Optical Flow计算光流有传统的方法。也有基于神经.原创 2020-05-19 22:38:18 · 251 阅读 · 0 评论