技术类
NRZZN
这个作者很懒,什么都没留下…
展开
-
【论文阅读】D3D: Distilled 3D Networks for Video Action Recognition
【论文阅读】D3D: Distilled 3D Networks for Video Action Recognition个人感觉这篇文章写得挺好的,而且由于太久没有看行为识别相关论文了,所以准备好好地看一下这篇论文,然后基于这篇论文地参考文献往前搜索。3D卷积网络中的运动信息提出问题:3D卷积网络到底能不能提取全部的运动信息呢?这是文章首先提出的第一个问题,我对这个问题也是非常地感兴趣。...原创 2019-07-19 20:48:08 · 1063 阅读 · 1 评论 -
【论文阅读】MiCT: Mixed 3D/2D Convolutional Tube for Human Action Recognition
【论文阅读】MiCT: Mixed 3D/2D Convolutional Tube for Human Action Recognition这是一篇2018年cvpr的关于3D卷积神经网络的论文,其实个人感觉还篇论文投2017年的cvpr比较合适。这篇文章还是解决3D卷积神经网络参数量大,在小数据集上不易训练,容易过拟合的问题。解决的思路就是使用3D和2D卷积核交替混合的思想,提出了MiCT...原创 2019-06-02 19:28:24 · 960 阅读 · 0 评论 -
【论文阅读】SkeletonNet Mining Deep Part Features for 3-D Action Recognition
【论文阅读】SkeletonNet Mining Deep Part Features for 3-D Action Recognition之前的构建的时空编码图都是以直接排列关节点的坐标来构建。这种时空编码图虽然能够通过归一化来克服平移不变性(translation)和尺度不变性(scale),但是始终存在一个缺陷:就是它始终对于旋转(rotation)是敏感的。本文为了解决这个问题,不再直接...原创 2019-07-19 20:50:49 · 383 阅读 · 0 评论 -
【论文阅读】Joint Distance Maps Based Action Recognition With Convolutional Neural Networks
【论文阅读】Joint Distance Maps Based Action Recognition With Convolutional Neural Networks这篇文章使用的是 成对关节点之间的欧拉距离来构建时空编码图,但是并没有什么理论支撑比之前使用坐标和使用CDNM特征构建的更有优势,但是可以当成一个方法的拓展。实验方法整个实验框架就是,分别构建xy、xz、yz和xyz空间的...原创 2019-07-19 20:50:30 · 354 阅读 · 0 评论 -
【论文阅读】Skeleton Based Action Recognition with Convolutional Neural Network
【论文阅读】Skeleton Based Action Recognition with Convolutional Neural Network这是基于骨骼的行为识别方法中,使用时空编码图的开山之作,后续还会介绍许多使用时空编码图的方法。正文整个方法的结构很简单,如上图所示,首先将骨骼序列编码为一张时空编码图,然后将时空编码图输入到卷积神经网络中,得到行为类别的识别结果。时空编码图的构...原创 2019-07-19 20:48:46 · 1182 阅读 · 0 评论 -
【论文阅读】A New Representation of Skeleton Sequences for 3D Action Recognition
【论文阅读】A New Representation of Skeleton Sequences for 3D Action Recognition这篇论文感觉写的太复杂,并不怎么好,所以只挑重点介绍一下就好。网络结构整个网络结构如上图所示,也是基于时空编码图的方法,时空编码图的构建方法:1.首先确定人体骨骼的4个参考关节点(两肩和两腿上),选这4个关节点的原因是这4个关节点在大多数的运...原创 2019-07-19 20:51:19 · 504 阅读 · 0 评论 -
【论文阅读】investigation of different skeleton features for cnn-based 3D action recognition
【论文阅读】investigation of different skeleton features for cnn-based 3D action recognition这篇论文主要实验了 在使用 骨骼关节的几何特征创建时空特征图时,各种特征的实验效果,也是挺有意思的。网络结构整个网络结构也很简单,就是选了很多种骨骼关节点几何特征构建时空特征图,然后将这些时空特征图输入到卷积神经网络中,...原创 2019-07-19 20:51:52 · 330 阅读 · 0 评论 -
【论文阅读】Skeleton Optical Spectra-Based Action Recognition Using Convolutional Neural Networks
【论文阅读】Skeleton Optical Spectra-Based Action Recognition Using Convolutional Neural Networks这篇文章是基于正交时空编码图的方法,时空编码图使用的是HSV模型,其中色彩信息H用来编码骨骼的时空信息,饱和度S和亮度V用来编码骨骼关节点的运动速度信息,这篇文章的一些想法还是挺有意思的。网络结构整个网络结构如...原创 2019-07-19 20:52:38 · 436 阅读 · 0 评论 -
【论文阅读】Action Recognition Based on Joint Trajectory Maps Using Convolutional Neural Networks
【论文阅读】Action Recognition Based on Joint Trajectory Maps Using Convolutional Neural Networks这篇文章也是属于正交编码图的方法之一,只不过该论文投影的是关节点轨迹,其整个论文形式和累积关节点的论文差不多一致的。网络结构整个网络结构如上图所示,骨骼序列首先生成3张正交编码图,该正交编码图是在3D空间累积关...原创 2019-07-19 20:52:07 · 628 阅读 · 0 评论 -
【论文阅读】Actions ~ Transformations
Actions ~ Transformations最近看行为识别论文,发现这篇论文一直都没有看过,但是引用也不少,所以抽出一个上午把这篇论文通读了一遍。这篇文章通过变换矩阵学习各种类别的行为的变化,即使用一个线性系统保存一种行为类别的动态变化,感觉想法是挺有意思的,目前我正想着能否将其应用于序列合成的问题。网络结构正如前言所说,文章使用一个线性系统来描述一类行为高层视觉信息的动态变化,为了...原创 2019-07-19 20:47:43 · 236 阅读 · 0 评论 -
【论文阅读】Hierarchical Recurrent Neural Network for Skeleton Based Action Recognition
【论文阅读】Hierarchical Recurrent Neural Network for Skeleton Based Action Recognition这篇论文使用LSTM对人体骨骼的时空特征直接建模,提出了一种级联地组合人体骨骼各个部分运动的方法,虽然我感觉最后的实验表明级联各个部分并没有太大的提升,但是也可能是数据集的原因,总体感觉想法还是好的。网络结构整个网络结构如上图所示...原创 2019-07-19 20:52:22 · 1013 阅读 · 0 评论 -
【论文阅读】VideoLSTM Convolves, Attends and Flows for Action Recognition
【论文阅读】VideoLSTM Convolves, Attends and Flows for Action Recognition这篇文章的主要贡献是在 Attention LSTM的基础上引入了 conv-lstm。文章将这种 conv-lstm +attention的结构称为 VideoLSTM。文章中生成 attention map 的方法 与 ALSTM也不完全一样,博客中也会介绍一...原创 2019-05-27 09:39:52 · 1676 阅读 · 0 评论 -
win10安装可以使用sift和surf的opencv-python
在anaconda中安装python-opencv最近发现安装的python-opencv里面没有sift,之前装的时候就没下载包含sift特征的contrib版的,只能把现在的版本卸载,重新安装包含有sift的contrib版了,所以在此记录一下。首先去网站上下载需要的python-opencv安装包(链接地址)。网站打开如下图所示,因为我的是python3.6 所以直接下载对应的版本即...原创 2019-03-22 10:53:07 · 1424 阅读 · 2 评论 -
win10+Anaconda5.0.1 python3.6 编译caffe的坑
执行官网给的第四步程序的时候C:\Projects\caffe> scripts\build_win.cmd它会自动检测你电脑的python版本,然后去下面网址下载依赖包https://github.com/willyd/caffe-builder/releases但是 截止到2017.11.23之前,只有python3.5或者python2.7的依赖包,没有对应pyt原创 2017-11-23 09:10:19 · 1520 阅读 · 0 评论 -
【论文阅读】Learning Spatio-Temporal Features with 3D Residual Networks for Action Recognition
【论文阅读】Learning Spatio-Temporal Features with 3D Residual Networks for Action Recognition这是2017ICCV workshop的一篇文章,这篇文章只是提出了一个3D-ResNets网络,与之前介绍的一篇文章链接地址非常非常相似,在结构上只有一点点不同,既然如此,那么我为什么还要介绍这一篇文章呢,因为本文最大的...原创 2018-12-12 21:31:29 · 3168 阅读 · 5 评论 -
【论文阅读】Human Action Recognition using Factorized Spatio-Temporal Convolutional Networks
【论文阅读】Human Action Recognition using Factorized Spatio-Temporal Convolutional Networks这是一篇15年ICCV的论文,在15年的时候,3D卷积网络刚刚兴起,但是因为3D卷积网络的参数量较多,而且训练数据的规模也没有现在这么大,所以网络的参数非常不易优化,这个时候,限制3D卷积网络性能的主要是数据。文章根据当时3D...原创 2018-12-09 10:55:13 · 3474 阅读 · 1 评论 -
【论文阅读】Learning Spatiotemporal Features with 3D Convolutional Networks
【论文阅读】Learning Spatiotemporal Features with 3D Convolutional Networks这是一篇15年ICCV的论文,本篇论文提出的C3D卷积网络是3D卷积网络的里程碑,以3D卷积核为基础的3D卷积网络从此发展起来。论文地址:下载地址基于pytorch的c3d模型代码:下载地址简介文章认为一个有效的视频描述子应该具备以下特点:良好的泛...原创 2018-12-07 12:05:48 · 12133 阅读 · 11 评论 -
【论文阅读】Learning Spatio-Temporal Representation with Pseudo-3D Residual Networks
【论文阅读】Learning Spatio-Temporal Representation with Pseudo-3D Residual Networks虽然这是一篇17年ICCV的论文,但是这篇论文里没有使用kinetics数据集,可能应该是作者做相关实验的时候kinetics数据集还没有发布吧,作者关注当时的3D卷积网络计算效率低、参数量大的问题。所以从减少参数量的角度切入,想到了将 3D...原创 2018-12-20 14:59:17 · 3441 阅读 · 0 评论 -
【论文阅读】Rethinking Spatiotemporal Feature Learning For Video Understanding
【论文阅读】Rethinking Spatiotemporal Feature Learning For Video Understanding这是一篇google的论文,它和之前介绍的一篇facebook的论文的研究内容非常相似链接地址,两篇论文放到ArXiv上只相差了一个月,但是个人感觉还是google的这篇写得好一些。(这篇博客解读的是早期版本的论文,后来新的版本的论文又在Somethin...原创 2018-12-26 20:16:14 · 3245 阅读 · 3 评论 -
【论文阅读】Quo Vadis, Action Recognition? A New Model and the Kinetics Dataset
【论文阅读】Quo Vadis, Action Recognition? A New Model and the Kinetics Dataset这是一篇2017CVPR的论文,我感觉这篇论文最大的贡献就是提出了kinetics数据集,这个数据集与之前的行为识别数据集相比有质的飞跃。同时文章也提出一种将2D卷积网络扩张成3D卷积网络的思想,使3D卷积网络可以收益于2D卷积网络的发展。感觉以后行为...原创 2018-12-10 17:05:28 · 10005 阅读 · 1 评论 -
【论文阅读】ConvNet Architecture Search for Spatiotemporal Feature Learning
【论文阅读】ConvNet Architecture Search for Spatiotemporal Feature Learning这是一篇和I3D同一时间的论文,论文的作者就是提出C3D网络的那个人,本文也是通过实验探索了更优的3D网络结构,提出了一种Res3D网络模型,该网络比C3D网络的FLOPs小两倍,比C3D网络的参数量小2倍,同时模型的性能也要好于C3D。论文地址:下载链接...原创 2018-12-12 10:47:29 · 3128 阅读 · 4 评论 -
【论文阅读】Long-term Temporal Convolutions for Action Recognition
【论文阅读】Long-term Temporal Convolutions for Action Recognition这篇论文之前,几乎所有的3D卷积网络的输入视频长度都很短,例如C3D、Res3D都只有16帧,那么长时输入视频对最终的结果有没有影响呢?所以本文探索了3D卷积网络输入视频的时长对识别效果的影响,发现输入视频时长越长,效果越好,从而提出了LTC 3D网络结构,同时文章评估了LTC...原创 2018-12-18 16:12:14 · 2282 阅读 · 1 评论 -
【论文阅读】Can Spatiotemporal 3D CNNs Retrace the History of 2D CNNs and ImageNet?
【论文阅读】Can Spatiotemporal 3D CNNs Retrace the History of 2D CNNs and ImageNet?之前提出的3D卷积网络的深度都很浅,因为当时的数据集都小,很容易过拟合。但是现在有了kinetics,那么这个数据集在训练3D卷积网络时还会过拟合吗?本文经过实验发现,kinetics数据集即使在训练非常深的3DCNN时也不会过拟合。我们知道在...原创 2018-12-18 20:07:38 · 4813 阅读 · 4 评论 -
【论文阅读】A Closer Look at Spatiotemporal Convolutions for Action Recognition
【论文阅读】A Closer Look at Spatiotemporal Convolutions for Action Recognition原创 2018-12-24 16:28:27 · 3984 阅读 · 6 评论 -
【论文阅读】Beyond Short Snippets: Deep Networks for Video Classification
【论文阅读】Beyond Short Snippets: Deep Networks for Video Classification之前3DCNN网络的论文算是记录完了,虽然最近又出了几篇,但是时间有限,很快要去实习去了,剩下的以后有时间再讲吧。本篇论文算是CNN+LSTM网络结构的开山之作,其实对于视频分析和行为识别这个任务目标,我们自然而然地想到的就是CNN+LSTM这种网络结构,简洁优...原创 2019-01-05 15:18:07 · 2808 阅读 · 2 评论 -
【论文阅读】Long-Term Recurrent Convolutional Networks for Visual Recognition and Description
【论文阅读】Long-Term Recurrent Convolutional Networks for Visual Recognition and Description这篇文章是15年的一篇文章,文章设计了CNN+LSTM的网络结构用于行为识别、图像描述、视频描述。本文的网络和之前介绍的一篇很像链接地址,区别主要在本文的网络使用的是端到端训练的,所以就非常非常非常简略地介绍一下这个网络,其...原创 2019-01-08 19:52:30 · 7026 阅读 · 5 评论 -
【论文阅读】Action Recognition Using Visual Attention
【论文阅读】Action Recognition Using Visual Attention这是一篇16年的CNN+LSTM形式的论文,它开创性地引入了注意力机制,使得15年之后沉寂许久的CNN+LSTM的网络结构的结果得到了提升,而且本文的探索性实验做的都非常地好,非常值得一读。论文地址:链接地址代码(pytorch):链接地址正文人的视觉并不会关注场景中的所有物体,而是通常会聚焦场...原创 2019-01-09 09:16:05 · 3339 阅读 · 6 评论 -
【论文阅读】Generating Videos with Scene Dynamics
【论文阅读】Generating Videos with Scene Dynamics这篇论文属于一篇视频生成的论文,论文将视频的前景和背景进行了解耦,分别使用3D卷积网络生成运动前景和使用2D卷积网络生成静态背景,同时在生成的过程之中使用了含有mask的显性表达式,之后会详细地介绍。正文该文章将运动前景的生成和静态背景的生成解耦了,首先输入为100维的噪声向量,然后使用3D转置卷积网络生成...原创 2019-08-11 20:00:40 · 756 阅读 · 0 评论