HumanActionRecognition
Amazingren
Do you prefer to sell sugar water for the rest of your life or come with me and change the world?
展开
-
【ECCV2016】Temporal Segment Networks(TSN)
〇、前言虽然在行为识别领域算是挣扎了好几个月了,但是其实都像无头苍蝇一样出来一个顶会的论文,就去找关键字是action recognition的,然后再看看有没有的代码的,虽然知道了这个领域时序建模能力很重要,但是都没有很好的理解。也一直没有狠下心从头开始学习或者从最经典的开始,比如TSN我看完只知道是很多方法的baseline,但是不知道到底为什么是baseLine的,里面的consensus...原创 2020-04-26 19:32:40 · 1055 阅读 · 1 评论 -
【CVPR2020】FineGym: A Hierarchical Video Dataset for Fine-grained Action Understanding
(1)是CVPR2020的满分oral文章。(2)作者:港中文的林达华团队(3)提出了一个细粒度的用于视频理解任务的数据集。具体的话就是行为识别等,具体的论文讲解的话原作者已经再知乎贴出来了:https://zhuanlan.zhihu.com/p/130720627(4)大概浏览了一下主要通过这篇文章自己的收获如下:视频数据集中的细粒度:在图片中的...原创 2020-04-22 15:01:02 · 1238 阅读 · 3 评论 -
【CVPR2020】Temporal Pyramid Network for Action Recognition
〇、基本信息:Title:Temporal Pyramid Network for Action RecognitionAuthor:港中文和商汤的工作,有大佬周博磊的参与一句话概括一下:This work addresses the importance of visual tempo within action recognitiong problem, and inspired by...原创 2020-04-20 22:52:09 · 3167 阅读 · 1 评论 -
运行商汤X-Temporal开源方案时后遇到的错误及解决方法
【报错一】. AttributeError: module 'yaml' has no attribute 'FullLoader'解决办法:pip install --ignore-installed PyYAML其中 AttributeError的意思就是说python找不到对应的对象的属性【报错二】ImportError: No module named 'pretraine...原创 2020-04-10 12:09:46 · 1450 阅读 · 1 评论 -
UCF101和HMDB51数据集的处理 for Human Action Recognition
〇、数据集简介:一、数据集获取:二、数据集解压缩:三、数据集预处理(划分):四、其他:原创 2020-04-09 12:44:57 · 8062 阅读 · 14 评论 -
计算机视觉方向如何阅读一篇论文,以《3D Convolutional Neural Networks for Human Action Recognition》为例
这里以《3D Convolutional Neural Networks for Human Action Recognition》为例进行,方便培养自己的论文阅读习惯,以后的论文都需要这样读〇、Make decision:论文标题:3D Convolutional Neural Networks for Human Action Recognition好了,通过标题我知道了这个是关于3...原创 2020-04-06 02:49:33 · 776 阅读 · 0 评论 -
【视频理解论文】——Grouped Spatial-Temporal Aggregation for Efficient Action Recognition(ICCV2019)
一、个人直观解读:文章动机:就是为了对基于3DCNN的视频行为识别中的参数进行控制,同时想要达到3DCNN的效果原文的描述就是一句话“reduce the complexity by decoupling the spatial and temporal filters”采取的方式:还是借鉴了TSN,TRN,这一类的利用2DCNN的网络结构,然后再次基础上拓展了P3D的工作,如下图所示也就...原创 2020-01-12 01:00:22 · 1577 阅读 · 6 评论 -
【数据集使用】Something-Something-v1以及v2数据集使用记录
一、记录动机最近在跑基于RGB的Action Recognition相关的实验,频繁的使用到了Something-Something数据集,关于使用中的过程大概记录一下,方便以后继续使用二、数据集介绍三、Something-Something v1使用下载地址:https://20bn.com/datasets/something-something/v1具体使用流程Step1: ...原创 2020-01-06 21:20:44 · 17851 阅读 · 72 评论 -
【行为识别综述准备】
首先,以后可以工作可以考虑一下基于图卷及的行为识别今年很多,且在数据集上性能领先。如下图所示:应用场景:【2019】Skeleton-based Action Recognition of People Handling Objects 【论文】recognizing object-related human actions偏向于应用场景通过构建skeletion-graph ...原创 2019-10-03 11:27:54 · 3653 阅读 · 0 评论 -
【视频理解论文】——SlowFast Networks for Video Recognition
SlowFast Networks for Video Recognition(ICCV2019)【摘要Abstract】所提出的SlowFast模型由两部分构成(1)Slow pathway:以低帧率获取Spatial信息;(2)Fast pathway: 以高帧率运行,以获取motion,也就是时序信息还强调了Fast pathway通过减少了通道的数量/容量,因此是以非常轻量级...原创 2019-09-16 15:01:39 · 1492 阅读 · 0 评论 -
【视频理解论文】——TSM:Temporal Shift Module for Efficient Video Understanding
TSM: Temporal Shift Module for Efficient Video Understanding这是一篇关于视频理解的文章,主要介绍了一种可以达到3DCNN的效果的,但是保持2DCNN计算量和参数量的方法,叫做TSM(Tempora Shift Module)也就是在一簇要处理的帧之间,把相邻帧之间的channel进行了交替拼接!比如我把第一帧图片的某个channel和第...原创 2019-09-11 00:57:04 · 7558 阅读 · 1 评论 -
【已读论文列表整理】——Human_Action_Recognition——持续更新
由于在距离开题只有十天的时间忽然被强制换到这个计算机视觉方向,主要就是人体行为识别,而且没啥可商量的,心情不是很舒服,但是也没办法,好事多磨吧!,总要多去接触,不是吗!Two-Stream Convolutional Networks for Action Recognition in Videos [论文主页]Convolutional Two-Stream Network Fusion...原创 2019-06-21 22:22:18 · 1104 阅读 · 0 评论