计算机视觉
文章平均质量分 94
计算机视觉论文解读
背包_十年
机器学习、计算机视觉、语音识别等方向学习。
展开
-
[调研报告]人脸识别
一、前述1. 发展以往的人脸识别主要是包括人脸图像采集、人脸识别预处理、身份确认、身份查找等技术和系统。现在人脸识别已经慢慢延伸到了ADAS中的驾驶员检测、行人跟踪、甚至到了动态物体的跟踪。由此可以看出,人脸识别系统已经由简单的图像处理发展到了视频实时处理。而且算法已经由以前的Adaboots、PCA等传统的统计学方法转变为CNN、RCNN等深度学习及其变形的方法。现在也有相当一部分人...原创 2016-10-31 15:55:37 · 25542 阅读 · 6 评论 -
[行为识别] 2018 AAAI 行为识别论文解读
[行为识别] 2018 AAAI 行为识别论文解读Action Detection[1] ++Action Recognition from Skeleton Data via Analogical Generalization over Qualitative Rep原创 2018-03-08 20:15:45 · 15951 阅读 · 1 评论 -
caffe了解
原文地址:http://blog.csdn.net/hjimce/article/details/48933813**作者:**hjimce本文主要讲解caffe的整个使用流程,适用于初级入门caffe,通过学习本篇博文,理清项目训练、测试流程。初级教程,高手请绕道。我们知道,在caffe编译完后,在caffe目录下会生成一个build目录,在build目录下有个tools,这个里面有个可执行文件c转载 2016-11-01 22:03:55 · 981 阅读 · 0 评论 -
基于CNN的性别、年龄识别
原文地址:http://blog.csdn.NET/hjimce/article/details/49255013**作者:**hjimce一、相关理论 本篇博文主要讲解2015年一篇paper《Age and Gender Classification using Convolutional Neural Networks》,个人感觉这篇文献没啥难度,只要懂得Alexnet,实现这篇文献的算法,转载 2016-11-02 11:09:13 · 2703 阅读 · 0 评论 -
神经网络
感知器1.定义 感知器是一种最简单的前馈神经网络,多输入单输出,是一种二分类。 优点:学习算法简单,易于理解。 缺点:学习速率低,学习效果差。不便于初学者运用,参数选择很难。2.算法 采用的是一种简单的惩罚机制。条件:样本特征值:x=[x1,x2........xn]x = [x_1, x_2 ........ x_n], y∈y \in { -1, 1}, 初始值θ\th原创 2015-08-22 10:52:27 · 1148 阅读 · 0 评论 -
卷积神经网络
原文地址:http://blog.csdn.NET/hjimce/article/details/47323463作者:hjimce卷积神经网络算法是n年前就有的算法,只是近年来因为深度学习相关算法为多层网络的训练提供了新方法,然后现在电脑的计算能力已非当年的那种计算水平,同时现在的训练数据很多,于是神经网络的相关算法又重新火了起来,因此卷积神经网络就又活了起来。在开始前,我们需要明确的是网上讲的卷转载 2016-10-31 16:18:16 · 1136 阅读 · 0 评论 -
[论文解读]VGGNet:Very Deep Convolution Networks for Large-Scale Image Recognition
1. 前言VGG是牛津大学计算机视觉组(Visual Geometry Group)和Google DeepMind公司研究员一起研发的深度卷积神经网络。VGGNet 探索了卷积神经网络的深度与其性能之间的关系,通过反复堆叠3x3的小型卷积核和2x2的最大池化层,VGGNet 成功地构筑了16~19层深的卷积神经网络。VGGNet 相比之前 state-of-the-art 的网络结构,错...原创 2018-01-12 11:53:19 · 708 阅读 · 0 评论 -
[目标检测|SSD实践一]caffe-ssd基线
本次实验利用caffe-ssd跑出了基线,主要从以下几个方向总结。 - caffe-ssd的编译 - caffe-ssd demo演示 - 自建数据集的数据准备 - fineTuning - 测试分析一、caffe基线实验源码地址在github:https://github.com/weiliu89/caffe/tree/ssd1.1 CPU版安装/...原创 2018-02-04 19:48:23 · 1856 阅读 · 0 评论 -
[行为识别] Two –Stream CNN for Action Recognition in Videos
这篇文章发表于2014 NIPS。也是牛津大学产出的。在这篇文章出来之前其实也有人尝试用深度学习来处理行为识别,例如李飞飞团队【Large-scale video classification with】通过叠加视频多帧输入到网络中进行学习,但是不幸的是这种方法比手动提取特征更加糟糕。当这篇文章出来以后才意味着深度学习在行为识别中迈出了重大的一步。一、前言这里主要阐述了论文的三个主要贡献点...原创 2018-01-17 19:15:32 · 5738 阅读 · 5 评论 -
[行为检测] CDC-Convolutional-De-Convolutional Networks for Precise Temporal Action Location
这篇文章是2017年ICCV的一篇文章《Convolutional-De-Convolutional Networks for Precise Temporal Action Localization in Untrimmed Videos》,下面是这篇文章的主要贡献点。第一次将卷积、反卷积操作应用到行为检测领域,文章同时在空间下采样,在时间域上上采样。利用CDC网络结果可以做到端到端的学...原创 2018-01-23 20:20:37 · 2644 阅读 · 1 评论 -
[干货|实践] Tensorflow学习 - 使用flags定义命令行参数
学习目的:深度学习神经网络往往有过多的Hyperparameter需要调优,优化算法、学习率、卷积核尺寸等很多参数都需要不断调整,使用命令行参数是非常方便的。有两种实现方式,一是利用python的argparse包,二是调用tensorflow自带的app.flags实现。利用tf.app.flags组件tf定义了tf.app.flags,用于接受命令行传递参数,相当于接受argv。首先调...原创 2018-01-23 20:25:44 · 1438 阅读 · 0 评论 -
[行为识别]RPAN:An end-to-end recurrent pose-attention network for action recognition
这篇文章是来自中科院深圳先进院乔宇老师,ICCV2017年的oral文章《RPAN:An End-to-End Recurrent Pose-Attention Network for Action Recognition in Videos》。这篇文章的出发点是当前行为识别的一大流行方向:RNN。与之前的video-level category 训练RNN不相同。这篇文章提出了引入pose-at...原创 2018-01-25 17:42:22 · 3825 阅读 · 2 评论 -
[行为检测]R-C3D-Resgion Convolutional 3D Network for Temporal Activity Detection
这篇文章是ICCV 2017的一篇文章,作者主要是以C3D网络为基础。借鉴了Faster RCNN的思路,对于任意的输入视频L,先进行proposal,然后3D-pooling,最后后进行分类和回归操作。文章主要贡献点有3个:可以针对任意长度视频、任意长度行为进行端到端的检测速度很快(是目前网络的5倍),通过共享Progposal generation 和Classification网络的...原创 2018-01-26 22:27:21 · 10070 阅读 · 6 评论