action or gesture recognition
文章平均质量分 95
xunan003
AI独角兽企业算法工程师
展开
-
video-caffe 搭建3DCNN并训练UCF-101例子
video-caffe github地址:https://github.com/chuckcho/video-caffe编译过程:Key steps to build video-caffe are:1.git clone https://github.com/chuckcho/video-caffe.git2.cd video-caffe3.cp Makefile.config.exampl...转载 2018-07-11 15:07:32 · 1124 阅读 · 0 评论 -
视频分类之UCF-101上的CNN方法详解
Code at Github: https://github.com/sujiongming/UCF-101_video_classificationPDF版(排版更好)下载链接:http://pan.baidu.com/s/1mieGZgO密码:33px视频分类包括人类行为识别和通用的多标签视频分类等研究内容。用的多标签视频分类以2016年谷歌发布的youtube-8M数据集为代表,其中很多...转载 2018-07-11 15:09:20 · 2136 阅读 · 1 评论 -
Video Analysis相关领域介绍之Action Recognition(行为识别)
这篇文章投稿在极视角公众号,微信链接 随着深度学习技术的发展,以及计算能力的进步(GPU等),现在基于视频的研究领域越来越受到重视。视频与图片最大的不同在于视频还包含了时序上的信息,此外需要的计算量通常也大很多。目前主要在做视频中动作定位相关的工作,为了开拓思路,读了不少视频分析相关领域的文章,所以打算写几篇博客,对视频分析相关的几个领域做一个简要的介绍。这篇主要介绍Action Recogn...转载 2018-07-11 15:10:34 · 689 阅读 · 0 评论 -
关于LSTM Layer在视频检测或识别任务中的作用的简单理解
LSTM为长短期记忆网络,故名思议它是具有记忆能力的,通俗讲就是可以联系上下文的信息对被离散开的时间信息进行组合。所以LSTM的的主要作用是“时间序列预测”。CNN或RNN对视频帧进行进行特征提取,提取出的特征被输出,而输出的特征也是离散的,即每一帧是每一帧的特征。而用于动作识别的网络中,在两组网络分别训练不同的模态(如RGB和Depth)后需要进行特征的融合。不管是CNN直接输出的特征还...原创 2018-07-23 12:05:34 · 6590 阅读 · 1 评论 -
caffe训练LRCN
(win7,无GPU,caffe python)https://people.eecs.berkeley.edu/~lisa_anne/LRCN_video有关于LRCN下载与运行的全部说明,其中文翻译附在后面。(虽然很简单,但是,还是觉得汉语更容易看懂)只要照它的步骤做就可以了。但是,我搞了很久,出现了一些问题。1.用的文件都在examples\lrcn_activity_recogniti...转载 2018-07-12 09:58:20 · 940 阅读 · 1 评论