- 博客(6)
- 资源 (1)
- 收藏
- 关注
原创 关于LSTM Layer在视频检测或识别任务中的作用的简单理解
LSTM为长短期记忆网络,故名思议它是具有记忆能力的,通俗讲就是可以联系上下文的信息对被离散开的时间信息进行组合。所以LSTM的的主要作用是“时间序列预测”。CNN或RNN对视频帧进行进行特征提取,提取出的特征被输出,而输出的特征也是离散的,即每一帧是每一帧的特征。而用于动作识别的网络中,在两组网络分别训练不同的模态(如RGB和Depth)后需要进行特征的融合。不管是CNN直接输出的特征还...
2018-07-23 12:05:34 6591 1
转载 caffe训练LRCN
(win7,无GPU,caffe python)https://people.eecs.berkeley.edu/~lisa_anne/LRCN_video有关于LRCN下载与运行的全部说明,其中文翻译附在后面。(虽然很简单,但是,还是觉得汉语更容易看懂)只要照它的步骤做就可以了。但是,我搞了很久,出现了一些问题。1.用的文件都在examples\lrcn_activity_recogniti...
2018-07-12 09:58:20 940 1
转载 DL序列训练中的Temporal和torch框架中的nn包解释
Temporal Modules用于处理序列信号,如声音,句子(自然语言处理常用)等。会有inputframe(共有多少帧)和inputframesize(一帧有多少维度表示)kernel都是一维的TemporalConvolution简单来说就是kernel是一维的。input tensor中每一个数字对应一个weight。module = nn.TemporalConvolution(in...
2018-07-12 09:29:05 1368
转载 Video Analysis相关领域介绍之Action Recognition(行为识别)
这篇文章投稿在极视角公众号,微信链接 随着深度学习技术的发展,以及计算能力的进步(GPU等),现在基于视频的研究领域越来越受到重视。视频与图片最大的不同在于视频还包含了时序上的信息,此外需要的计算量通常也大很多。目前主要在做视频中动作定位相关的工作,为了开拓思路,读了不少视频分析相关领域的文章,所以打算写几篇博客,对视频分析相关的几个领域做一个简要的介绍。这篇主要介绍Action Recogn...
2018-07-11 15:10:34 689
转载 视频分类之UCF-101上的CNN方法详解
Code at Github: https://github.com/sujiongming/UCF-101_video_classificationPDF版(排版更好)下载链接:http://pan.baidu.com/s/1mieGZgO密码:33px视频分类包括人类行为识别和通用的多标签视频分类等研究内容。用的多标签视频分类以2016年谷歌发布的youtube-8M数据集为代表,其中很多...
2018-07-11 15:09:20 2137 1
转载 video-caffe 搭建3DCNN并训练UCF-101例子
video-caffe github地址:https://github.com/chuckcho/video-caffe编译过程:Key steps to build video-caffe are:1.git clone https://github.com/chuckcho/video-caffe.git2.cd video-caffe3.cp Makefile.config.exampl...
2018-07-11 15:07:32 1124
Navel Orange Diseased Leaf Identification Dataset
2022-12-14
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人