技术类_NRZZN的博客-CSDN博客

技术类

关注

关注数：文章数：28 文章阅读量：75300 文章收藏量：417

作者: NRZZN

这个作者很懒，什么都没留下…

展开

【论文阅读】D3D: Distilled 3D Networks for Video Action Recognition

【论文阅读】D3D: Distilled 3D Networks for Video Action Recognition个人感觉这篇文章写得挺好的，而且由于太久没有看行为识别相关论文了，所以准备好好地看一下这篇论文，然后基于这篇论文地参考文献往前搜索。3D卷积网络中的运动信息提出问题：3D卷积网络到底能不能提取全部的运动信息呢？这是文章首先提出的第一个问题，我对这个问题也是非常地感兴趣。...

原创 2019-07-19 20:48:08 · 1063 阅读 · 1 评论
【论文阅读】MiCT: Mixed 3D/2D Convolutional Tube for Human Action Recognition

【论文阅读】MiCT: Mixed 3D/2D Convolutional Tube for Human Action Recognition这是一篇2018年cvpr的关于3D卷积神经网络的论文，其实个人感觉还篇论文投2017年的cvpr比较合适。这篇文章还是解决3D卷积神经网络参数量大，在小数据集上不易训练，容易过拟合的问题。解决的思路就是使用3D和2D卷积核交替混合的思想，提出了MiCT...

原创 2019-06-02 19:28:24 · 960 阅读 · 0 评论
【论文阅读】SkeletonNet Mining Deep Part Features for 3-D Action Recognition

【论文阅读】SkeletonNet Mining Deep Part Features for 3-D Action Recognition之前的构建的时空编码图都是以直接排列关节点的坐标来构建。这种时空编码图虽然能够通过归一化来克服平移不变性（translation）和尺度不变性（scale），但是始终存在一个缺陷：就是它始终对于旋转（rotation）是敏感的。本文为了解决这个问题，不再直接...

原创 2019-07-19 20:50:49 · 383 阅读 · 0 评论
【论文阅读】Joint Distance Maps Based Action Recognition With Convolutional Neural Networks

【论文阅读】Joint Distance Maps Based Action Recognition With Convolutional Neural Networks这篇文章使用的是成对关节点之间的欧拉距离来构建时空编码图，但是并没有什么理论支撑比之前使用坐标和使用CDNM特征构建的更有优势，但是可以当成一个方法的拓展。实验方法整个实验框架就是，分别构建xy、xz、yz和xyz空间的...

原创 2019-07-19 20:50:30 · 354 阅读 · 0 评论
【论文阅读】Skeleton Based Action Recognition with Convolutional Neural Network

【论文阅读】Skeleton Based Action Recognition with Convolutional Neural Network这是基于骨骼的行为识别方法中，使用时空编码图的开山之作，后续还会介绍许多使用时空编码图的方法。正文整个方法的结构很简单，如上图所示，首先将骨骼序列编码为一张时空编码图，然后将时空编码图输入到卷积神经网络中，得到行为类别的识别结果。时空编码图的构...

原创 2019-07-19 20:48:46 · 1182 阅读 · 0 评论
【论文阅读】A New Representation of Skeleton Sequences for 3D Action Recognition

【论文阅读】A New Representation of Skeleton Sequences for 3D Action Recognition这篇论文感觉写的太复杂，并不怎么好，所以只挑重点介绍一下就好。网络结构整个网络结构如上图所示，也是基于时空编码图的方法，时空编码图的构建方法：1.首先确定人体骨骼的4个参考关节点（两肩和两腿上），选这4个关节点的原因是这4个关节点在大多数的运...

原创 2019-07-19 20:51:19 · 504 阅读 · 0 评论
【论文阅读】investigation of different skeleton features for cnn-based 3D action recognition

【论文阅读】investigation of different skeleton features for cnn-based 3D action recognition这篇论文主要实验了在使用骨骼关节的几何特征创建时空特征图时，各种特征的实验效果，也是挺有意思的。网络结构整个网络结构也很简单，就是选了很多种骨骼关节点几何特征构建时空特征图，然后将这些时空特征图输入到卷积神经网络中，...

原创 2019-07-19 20:51:52 · 330 阅读 · 0 评论
【论文阅读】Skeleton Optical Spectra-Based Action Recognition Using Convolutional Neural Networks

【论文阅读】Skeleton Optical Spectra-Based Action Recognition Using Convolutional Neural Networks这篇文章是基于正交时空编码图的方法，时空编码图使用的是HSV模型，其中色彩信息H用来编码骨骼的时空信息，饱和度S和亮度V用来编码骨骼关节点的运动速度信息，这篇文章的一些想法还是挺有意思的。网络结构整个网络结构如...

原创 2019-07-19 20:52:38 · 436 阅读 · 0 评论
【论文阅读】Action Recognition Based on Joint Trajectory Maps Using Convolutional Neural Networks

【论文阅读】Action Recognition Based on Joint Trajectory Maps Using Convolutional Neural Networks这篇文章也是属于正交编码图的方法之一，只不过该论文投影的是关节点轨迹，其整个论文形式和累积关节点的论文差不多一致的。网络结构整个网络结构如上图所示，骨骼序列首先生成3张正交编码图，该正交编码图是在3D空间累积关...

原创 2019-07-19 20:52:07 · 628 阅读 · 0 评论
【论文阅读】Actions ~ Transformations

Actions ~ Transformations最近看行为识别论文，发现这篇论文一直都没有看过，但是引用也不少，所以抽出一个上午把这篇论文通读了一遍。这篇文章通过变换矩阵学习各种类别的行为的变化，即使用一个线性系统保存一种行为类别的动态变化，感觉想法是挺有意思的，目前我正想着能否将其应用于序列合成的问题。网络结构正如前言所说，文章使用一个线性系统来描述一类行为高层视觉信息的动态变化，为了...

原创 2019-07-19 20:47:43 · 236 阅读 · 0 评论
【论文阅读】Hierarchical Recurrent Neural Network for Skeleton Based Action Recognition

【论文阅读】Hierarchical Recurrent Neural Network for Skeleton Based Action Recognition这篇论文使用LSTM对人体骨骼的时空特征直接建模，提出了一种级联地组合人体骨骼各个部分运动的方法，虽然我感觉最后的实验表明级联各个部分并没有太大的提升，但是也可能是数据集的原因，总体感觉想法还是好的。网络结构整个网络结构如上图所示...

原创 2019-07-19 20:52:22 · 1013 阅读 · 0 评论
【论文阅读】VideoLSTM Convolves, Attends and Flows for Action Recognition

【论文阅读】VideoLSTM Convolves, Attends and Flows for Action Recognition这篇文章的主要贡献是在 Attention LSTM的基础上引入了 conv-lstm。文章将这种 conv-lstm +attention的结构称为 VideoLSTM。文章中生成 attention map 的方法与 ALSTM也不完全一样，博客中也会介绍一...

原创 2019-05-27 09:39:52 · 1676 阅读 · 0 评论
win10安装可以使用sift和surf的opencv-python

在anaconda中安装python-opencv最近发现安装的python-opencv里面没有sift，之前装的时候就没下载包含sift特征的contrib版的，只能把现在的版本卸载，重新安装包含有sift的contrib版了，所以在此记录一下。首先去网站上下载需要的python-opencv安装包（链接地址）。网站打开如下图所示，因为我的是python3.6 所以直接下载对应的版本即...

原创 2019-03-22 10:53:07 · 1424 阅读 · 2 评论
win10+Anaconda5.0.1 python3.6 编译caffe的坑

执行官网给的第四步程序的时候C:\Projects\caffe> scripts\build_win.cmd它会自动检测你电脑的python版本，然后去下面网址下载依赖包https://github.com/willyd/caffe-builder/releases但是截止到2017.11.23之前，只有python3.5或者python2.7的依赖包，没有对应pyt

原创 2017-11-23 09:10:19 · 1520 阅读 · 0 评论
【论文阅读】Learning Spatio-Temporal Features with 3D Residual Networks for Action Recognition

【论文阅读】Learning Spatio-Temporal Features with 3D Residual Networks for Action Recognition这是2017ICCV workshop的一篇文章，这篇文章只是提出了一个3D-ResNets网络，与之前介绍的一篇文章链接地址非常非常相似，在结构上只有一点点不同，既然如此，那么我为什么还要介绍这一篇文章呢，因为本文最大的...

原创 2018-12-12 21:31:29 · 3168 阅读 · 5 评论
【论文阅读】Human Action Recognition using Factorized Spatio-Temporal Convolutional Networks

【论文阅读】Human Action Recognition using Factorized Spatio-Temporal Convolutional Networks这是一篇15年ICCV的论文，在15年的时候，3D卷积网络刚刚兴起，但是因为3D卷积网络的参数量较多，而且训练数据的规模也没有现在这么大，所以网络的参数非常不易优化，这个时候，限制3D卷积网络性能的主要是数据。文章根据当时3D...

原创 2018-12-09 10:55:13 · 3474 阅读 · 1 评论
【论文阅读】Learning Spatiotemporal Features with 3D Convolutional Networks

【论文阅读】Learning Spatiotemporal Features with 3D Convolutional Networks这是一篇15年ICCV的论文，本篇论文提出的C3D卷积网络是3D卷积网络的里程碑，以3D卷积核为基础的3D卷积网络从此发展起来。论文地址：下载地址基于pytorch的c3d模型代码：下载地址简介文章认为一个有效的视频描述子应该具备以下特点：良好的泛...

原创 2018-12-07 12:05:48 · 12133 阅读 · 11 评论
【论文阅读】Learning Spatio-Temporal Representation with Pseudo-3D Residual Networks

【论文阅读】Learning Spatio-Temporal Representation with Pseudo-3D Residual Networks虽然这是一篇17年ICCV的论文，但是这篇论文里没有使用kinetics数据集，可能应该是作者做相关实验的时候kinetics数据集还没有发布吧，作者关注当时的3D卷积网络计算效率低、参数量大的问题。所以从减少参数量的角度切入，想到了将 3D...

原创 2018-12-20 14:59:17 · 3441 阅读 · 0 评论
【论文阅读】Rethinking Spatiotemporal Feature Learning For Video Understanding

【论文阅读】Rethinking Spatiotemporal Feature Learning For Video Understanding这是一篇google的论文，它和之前介绍的一篇facebook的论文的研究内容非常相似链接地址，两篇论文放到ArXiv上只相差了一个月，但是个人感觉还是google的这篇写得好一些。（这篇博客解读的是早期版本的论文，后来新的版本的论文又在Somethin...

原创 2018-12-26 20:16:14 · 3245 阅读 · 3 评论
【论文阅读】Quo Vadis, Action Recognition? A New Model and the Kinetics Dataset

【论文阅读】Quo Vadis, Action Recognition? A New Model and the Kinetics Dataset这是一篇2017CVPR的论文，我感觉这篇论文最大的贡献就是提出了kinetics数据集，这个数据集与之前的行为识别数据集相比有质的飞跃。同时文章也提出一种将2D卷积网络扩张成3D卷积网络的思想，使3D卷积网络可以收益于2D卷积网络的发展。感觉以后行为...

原创 2018-12-10 17:05:28 · 10005 阅读 · 1 评论
【论文阅读】ConvNet Architecture Search for Spatiotemporal Feature Learning

【论文阅读】ConvNet Architecture Search for Spatiotemporal Feature Learning这是一篇和I3D同一时间的论文，论文的作者就是提出C3D网络的那个人，本文也是通过实验探索了更优的3D网络结构，提出了一种Res3D网络模型，该网络比C3D网络的FLOPs小两倍，比C3D网络的参数量小2倍，同时模型的性能也要好于C3D。论文地址：下载链接...

原创 2018-12-12 10:47:29 · 3128 阅读 · 4 评论
【论文阅读】Long-term Temporal Convolutions for Action Recognition

【论文阅读】Long-term Temporal Convolutions for Action Recognition这篇论文之前，几乎所有的3D卷积网络的输入视频长度都很短，例如C3D、Res3D都只有16帧，那么长时输入视频对最终的结果有没有影响呢？所以本文探索了3D卷积网络输入视频的时长对识别效果的影响，发现输入视频时长越长，效果越好，从而提出了LTC 3D网络结构，同时文章评估了LTC...

原创 2018-12-18 16:12:14 · 2282 阅读 · 1 评论
【论文阅读】Can Spatiotemporal 3D CNNs Retrace the History of 2D CNNs and ImageNet?

【论文阅读】Can Spatiotemporal 3D CNNs Retrace the History of 2D CNNs and ImageNet?之前提出的3D卷积网络的深度都很浅，因为当时的数据集都小，很容易过拟合。但是现在有了kinetics，那么这个数据集在训练3D卷积网络时还会过拟合吗？本文经过实验发现，kinetics数据集即使在训练非常深的3DCNN时也不会过拟合。我们知道在...

原创 2018-12-18 20:07:38 · 4813 阅读 · 4 评论
【论文阅读】A Closer Look at Spatiotemporal Convolutions for Action Recognition

【论文阅读】A Closer Look at Spatiotemporal Convolutions for Action Recognition

原创 2018-12-24 16:28:27 · 3984 阅读 · 6 评论
【论文阅读】Beyond Short Snippets: Deep Networks for Video Classification

【论文阅读】Beyond Short Snippets: Deep Networks for Video Classification之前3DCNN网络的论文算是记录完了，虽然最近又出了几篇，但是时间有限，很快要去实习去了，剩下的以后有时间再讲吧。本篇论文算是CNN+LSTM网络结构的开山之作，其实对于视频分析和行为识别这个任务目标，我们自然而然地想到的就是CNN+LSTM这种网络结构，简洁优...

原创 2019-01-05 15:18:07 · 2808 阅读 · 2 评论
【论文阅读】Long-Term Recurrent Convolutional Networks for Visual Recognition and Description

【论文阅读】Long-Term Recurrent Convolutional Networks for Visual Recognition and Description这篇文章是15年的一篇文章，文章设计了CNN+LSTM的网络结构用于行为识别、图像描述、视频描述。本文的网络和之前介绍的一篇很像链接地址，区别主要在本文的网络使用的是端到端训练的，所以就非常非常非常简略地介绍一下这个网络，其...

原创 2019-01-08 19:52:30 · 7026 阅读 · 5 评论
【论文阅读】Action Recognition Using Visual Attention

【论文阅读】Action Recognition Using Visual Attention这是一篇16年的CNN+LSTM形式的论文，它开创性地引入了注意力机制，使得15年之后沉寂许久的CNN+LSTM的网络结构的结果得到了提升，而且本文的探索性实验做的都非常地好，非常值得一读。论文地址：链接地址代码（pytorch）：链接地址正文人的视觉并不会关注场景中的所有物体，而是通常会聚焦场...

原创 2019-01-09 09:16:05 · 3339 阅读 · 6 评论
【论文阅读】Generating Videos with Scene Dynamics

【论文阅读】Generating Videos with Scene Dynamics这篇论文属于一篇视频生成的论文，论文将视频的前景和背景进行了解耦，分别使用3D卷积网络生成运动前景和使用2D卷积网络生成静态背景，同时在生成的过程之中使用了含有mask的显性表达式，之后会详细地介绍。正文该文章将运动前景的生成和静态背景的生成解耦了，首先输入为100维的噪声向量，然后使用3D转置卷积网络生成...

原创 2019-08-11 20:00:40 · 756 阅读 · 0 评论

技术类

作者: NRZZN

【论文阅读】D3D: Distilled 3D Networks for Video Action Recognition

【论文阅读】MiCT: Mixed 3D/2D Convolutional Tube for Human Action Recognition

【论文阅读】SkeletonNet Mining Deep Part Features for 3-D Action Recognition

【论文阅读】Joint Distance Maps Based Action Recognition With Convolutional Neural Networks

【论文阅读】Skeleton Based Action Recognition with Convolutional Neural Network

【论文阅读】A New Representation of Skeleton Sequences for 3D Action Recognition

【论文阅读】investigation of different skeleton features for cnn-based 3D action recognition

【论文阅读】Skeleton Optical Spectra-Based Action Recognition Using Convolutional Neural Networks

【论文阅读】Action Recognition Based on Joint Trajectory Maps Using Convolutional Neural Networks

【论文阅读】Actions ~ Transformations

【论文阅读】Hierarchical Recurrent Neural Network for Skeleton Based Action Recognition

【论文阅读】VideoLSTM Convolves, Attends and Flows for Action Recognition

win10安装可以使用sift和surf的opencv-python

win10+Anaconda5.0.1 python3.6 编译caffe的坑

【论文阅读】Learning Spatio-Temporal Features with 3D Residual Networks for Action Recognition

【论文阅读】Human Action Recognition using Factorized Spatio-Temporal Convolutional Networks

【论文阅读】Learning Spatiotemporal Features with 3D Convolutional Networks

【论文阅读】Learning Spatio-Temporal Representation with Pseudo-3D Residual Networks

【论文阅读】Rethinking Spatiotemporal Feature Learning For Video Understanding

【论文阅读】Quo Vadis, Action Recognition? A New Model and the Kinetics Dataset

【论文阅读】ConvNet Architecture Search for Spatiotemporal Feature Learning

【论文阅读】Long-term Temporal Convolutions for Action Recognition

【论文阅读】Can Spatiotemporal 3D CNNs Retrace the History of 2D CNNs and ImageNet?

【论文阅读】A Closer Look at Spatiotemporal Convolutions for Action Recognition

【论文阅读】Beyond Short Snippets: Deep Networks for Video Classification

【论文阅读】Long-Term Recurrent Convolutional Networks for Visual Recognition and Description

【论文阅读】Action Recognition Using Visual Attention

【论文阅读】Generating Videos with Scene Dynamics