faiculty

欢迎大家移步到个人blog：https://faiculty.com/，每天更新机器学习算法实践，计算机视觉、NLP等方向的资讯等。

03月 02月 01月

原创 [行为检测]R-C3D-Resgion Convolutional 3D Network for Temporal Activity Detection

这篇文章是ICCV 2017的一篇文章，作者主要是以C3D网络为基础。借鉴了Faster RCNN的思路，对于任意的输入视频L，先进行proposal，然后3D-pooling,最后后进行分类和回归操作。文章主要贡献点有3个：可以针对任意长度视频、任意长度行为进行端到端的检测速度很快(是目前网络的5倍)，通过共享Progposal generation 和Classification网络的...

2018-01-26 22:27:21 10071 6

原创 [行为识别]RPAN：An end-to-end recurrent pose-attention network for action recognition

这篇文章是来自中科院深圳先进院乔宇老师，ICCV2017年的oral文章《RPAN：An End-to-End Recurrent Pose-Attention Network for Action Recognition in Videos》。这篇文章的出发点是当前行为识别的一大流行方向：RNN。与之前的video-level category 训练RNN不相同。这篇文章提出了引入pose-at...

2018-01-25 17:42:22 3825 2

原创 [干货|实践] Tensorflow学习 - 使用flags定义命令行参数

学习目的：深度学习神经网络往往有过多的Hyperparameter需要调优，优化算法、学习率、卷积核尺寸等很多参数都需要不断调整，使用命令行参数是非常方便的。有两种实现方式，一是利用python的argparse包，二是调用tensorflow自带的app.flags实现。利用tf.app.flags组件tf定义了tf.app.flags，用于接受命令行传递参数，相当于接受argv。首先调...

2018-01-23 20:25:44 1439

原创 [行为检测] CDC-Convolutional-De-Convolutional Networks for Precise Temporal Action Location

这篇文章是2017年ICCV的一篇文章《Convolutional-De-Convolutional Networks for Precise Temporal Action Localization in Untrimmed Videos》，下面是这篇文章的主要贡献点。第一次将卷积、反卷积操作应用到行为检测领域，文章同时在空间下采样，在时间域上上采样。利用CDC网络结果可以做到端到端的学...

2018-01-23 20:20:37 2645 1

原创 [干货|实践] Tensorflow可视化

TensorBoard简介：TensorBoard是tensorflow官方推出的可视化工具，它可以将模型训练过程中的各种汇总数据展示出来，包括标量(Scalars)、图片(Images)、音频(Audio)、计算图(Graphs)、数据分布(Distributions)、直方图(Histograms)和潜入向量(Embeddigngs)。作用：tensorflow代码执行过程是先构建图，...

2018-01-22 15:08:03 1455

原创 [目标检测] RON-Reverse Connection with Objectness Prior Networks for Object Detection

当前最好的基于深度网络的目标检测框架可以分为两个主要方法流派：基于区域的方法（region-based）和不基于区域（region-free）的方法。两种方法各有优势和劣势。由清华大学计算机系智能技术与系统国家重点实验室、清华国家信息实验室、清华大学计算机科学与技术系、英特尔中国研究院、清华大学电子工程系的研究人员共同参与的关于高效视觉目标检测的研究已经被 CVPR 2017 接收。论文题...

2018-01-20 16:11:32 2162

原创 [行为识别] Two –Stream CNN for Action Recognition in Videos

这篇文章发表于2014 NIPS。也是牛津大学产出的。在这篇文章出来之前其实也有人尝试用深度学习来处理行为识别，例如李飞飞团队【Large-scale video classification with】通过叠加视频多帧输入到网络中进行学习，但是不幸的是这种方法比手动提取特征更加糟糕。当这篇文章出来以后才意味着深度学习在行为识别中迈出了重大的一步。一、前言这里主要阐述了论文的三个主要贡献点...

2018-01-17 19:15:32 5740 5

原创 [目标检测]SSD：Single Shot MultiBox Detector

基于”Proposal + Classification”的Object Detection的方法，RCNN系列(R-CNN、SPPnet、Fast R-CNN以及Faster R-CNN)取得了非常好的效果，因为这一类方法先预先回归一次边框，然后再进行骨干网络训练，所以精度要高，这类方法被称为two stage的方法。但也正是由于此，这类方法在速度方面还有待改进。由此，YOLO[8]应运而生，Y...

2018-01-14 17:09:15 13959 2

原创 [深度学习基础] 初见dropout

1. 初见dropoutDropout是2012年深度学习视觉领域的开山之作paper：《ImageNet Classification with Deep Convolutional》所提到的算法，用于防止过拟合。基本思想： dropout是指在深度学习网络训练的过程中，对于神经网络单元，按照一定的概率将其==暂时==从网络中丢弃，对于随机梯度下降算法来说，由于是随机丢弃，所以每...

2018-01-13 20:53:08 565

原创 [论文解读]VGGNet：Very Deep Convolution Networks for Large-Scale Image Recognition

1. 前言VGG是牛津大学计算机视觉组(Visual Geometry Group)和Google DeepMind公司研究员一起研发的深度卷积神经网络。VGGNet 探索了卷积神经网络的深度与其性能之间的关系，通过反复堆叠3x3的小型卷积核和2x2的最大池化层，VGGNet 成功地构筑了16~19层深的卷积神经网络。VGGNet 相比之前 state-of-the-art 的网络结构，错...

2018-01-12 11:53:19 709

空空如也

markdown编辑时，如何使每段文字开头空两格啊。。求高手指导

2015-02-27

TA创建的收藏夹 TA关注的收藏夹

TA关注的人