自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

灰巧克力爱松露

这个人很懒,什么也没写~

原创 Wasserstein GAN

来自Martin Arjovsky等人的“Wasserstein GAN”。

2017-03-12 10:00:48

阅读数 5492

评论数 0

原创 对抗的训练来从模拟和无监督图像中学习

来自Ashish Shrivastava等人的文章“Learning from Simulated and Unsupervised Images through Adversarial Training”。

2017-02-15 08:52:39

阅读数 3399

评论数 2

原创 检测9000类物体的YOLO9000

本想总结一下,看完发现整篇文章多余的话有点少。YOLO的实时性众所周知,所以还等什么,皮皮虾我们走~

2017-02-11 12:58:36

阅读数 7141

评论数 9

原创 用核化的相关滤波器来高速跟踪

原文来自 Joao F. Henriques 等人的“High-Speed Tracking with Kernelized Correlation Filters”。

2016-11-18 15:07:55

阅读数 10063

评论数 7

原创 使用快速权重来关注最近的过去

Jimmy Ba 及 Geoffrey Hinton 等人的文章“Using Fast Weights to Attend to the Recent Past”。

2016-10-31 14:38:10

阅读数 4084

评论数 1

原创 反卷积与棋盘效应

来自 Google Brain 的 Augustus Odena 等人的文章“Deconvolution and Checkerboard Artifacts“的部分内容。

2016-10-23 23:12:27

阅读数 5659

评论数 1

原创 对抗的深度卷积生成网络来学习无监督表示

Unsupervised Representation Learning with Deep Convolutional Generative Adversarial Networks.

2016-10-03 23:34:16

阅读数 9758

评论数 5

原创 与判别网络对抗的生成网络 (Generative Adversarial Nets)

Generative Adversarial Nets / GANs

2016-10-01 01:11:50

阅读数 5612

评论数 11

原创 循环和递归神经网络 (RNN) 与 长短时记忆 (LSTM)

即使不是 NLPer,现实中依然会面对很多序列问题。 全文内容来自 Ian Goodfellow, Yoshua Bengio 和 Aaron Courville 3位大老爷的作品“Deep Learning”的其中一章“Sequence Modeling: Recurrent and Recu...

2016-07-13 10:35:49

阅读数 13173

评论数 0

原创 R-FCN:基于区域的全卷积网络来检测物体

CVPR 2016 阅读~ 原文标题为“R-FCN: Object Detection via Region-based Fully Convolutional Networks ”。

2016-06-29 14:07:07

阅读数 41423

评论数 20

原创 CRAFT:级联的区域建议网络与快速RCNN结合

Benchmark上采用卷积神经网络提取特征的物体检测,通过改变卷积网络每层的参数似乎已羞于灌水~ 不过依然有人在指标上有一点改进,以国内李子青组的Bin Yang在 CVPR 2016 上发表的文章“CRAFT: Objects from Images”为例,看看基于卷积神经网络的物体检测问题还...

2016-06-27 09:53:15

阅读数 3867

评论数 1

原创 FPGA视觉从入门到放弃——稀疏编码的原理与简单应用

先试一下它的效果。根据MNIST公开的分类器,误分类率小于0.6%的与卷积网络相关的方法主要有两种:2008年的“无监督稀疏特征 + 支持向量机”和起始于1998年的“卷积网络”。两者的特征提取分别基于稀疏编码和卷积神经网络。

2016-06-23 22:35:30

阅读数 1540

评论数 0

原创 FPGA视觉从入门到放弃——小波矩与支持向量机刷MNIST

小波矩是FPGA板已有的模块,而深度学习框架下的MNIST的测试准确率可轻松地到99%以上。这里得到的效果不足以超越后者,由于内部影响依然做了该实验。所以,这些时间只够买个教训~

2016-06-21 16:12:00

阅读数 1281

评论数 0

原创 FPGA视觉从入门到放弃——懒人的支持向量机

支持向量机曾是机器学习领域中的主流方法。针对小样本,现在用起来依然很方便。同时,该方面的工具和教程多得数不清。所以这里引用老师木的话就很合适:“经常,有些事还没做就已经知道它无意义,于是就没做;有些事做不做都知道无意义,还是蠢蠢欲动”。本篇围绕“用现有的库把自己的代码工作量减到最小”为话题,以比大...

2016-05-31 00:10:04

阅读数 1395

评论数 0

原创 FPGA视觉从入门到放弃——削苹果剩下的小波矩

与特征点等主流方法相比,小波矩是计算机视觉中古老的偏方,追溯到1962年。虽很少提及,但该方法的思路比较有意思。 后面以小波矩”从哪里来用到哪里去“为主线描述。数学渣顺便强行解释一波理论,请原谅我这里教材式的引用。~( ̄▽ ̄)~( ̄▽ ̄)~

2016-05-27 03:21:09

阅读数 1372

评论数 0

原创 FPGA视觉从入门到放弃——可变光照下结构化模板对边缘提取的影响

FPGA视觉从入门到放弃——可变光照下结构化模板对边缘提取的影响 1. 结构化模板 FPGA视觉和计算机视觉的硬件区别在于,计算机(无GPU)串行运行代码,FPGA编译后生成并行计算的逻辑电路。计算机运行时可以边加载边释放内存空间,FPGA烧写后的电路是固定不变的从而无法释放空间。所以,实验中...

2016-05-06 22:19:11

阅读数 1472

评论数 0

原创 FPGA视觉从入门到放弃——灰度直方图提取

FPGA视觉从入门到放弃——灰度直方图提取 一.贴士 1.系统寄存器sysreg0相同的1位线:collect_enable,FPGA_A_DSP_B,DSP_reset_FPGA; 2.系统寄存器相同的16位线:pix_num_threshold,crmaxmin,cbmaxmin。 3.连...

2016-04-23 00:10:25

阅读数 2971

评论数 1

原创 FPGA视觉从入门到放弃——Canny算子

FPGA视觉从入门到放弃——Canny算子 一. FPGA视觉从入门到放弃简介 本笔记仅适合实验室内部的FPGA图像采集卡,并不适合计算机视觉中的高大上场合,但功耗和速度很阔怕,同时方法简单得阔怕。毕竟没有什么方法或工具可以永远时尚下去,所以从入门到放弃也算是进步之选嘛~ 二...

2016-04-21 21:37:08

阅读数 4338

评论数 2

原创 Caffe与Lasagne使用——人脸关键点检测

Caffe与Lasagne 使用——人脸关键点检测 一. Caffe求解回归问题 在使用Lasagne之前,我尝试用Caffe做回归问题。毕竟Lasagne是基于Theano的,所以训练速度上Caffe占优。 1. 尝试方法 清理掉标签数据中的NaN值后,尝试过下述方法: (1) 输出数据根据...

2016-04-13 17:28:52

阅读数 3720

评论数 4

原创 Doppia(version-2)编译

Doppia(version-2)编译 1. Doppia简介 该C++和CUDA代码提供从立体图像中估计stixels,从单幅图像中检测行人和为新类训练检测器[1]。 2. Doppia编译参考 JpHu分四部分讲述Doppia version-1的编译及其准备工作[6],介绍...

2015-12-23 15:14:36

阅读数 1456

评论数 0

原创 Caffe学习——使用自己的数据(非图像)训练网络

Caffe学习——使用自己的数据(非图像)训练网络 1. 鸢尾花卉数据集 鸢尾花卉数据集包含150个样本,4个特征(花萼长度,花萼宽度,花瓣长度和花瓣宽度),3个类别(山鸢尾,变色鸢尾和维吉尼亚鸢尾)[1]。 2. 所需的准备文件说明 (1)prototxt文件 xx_deplo...

2015-12-22 22:55:09

阅读数 13281

评论数 57

原创 Caffe学习——Imagenet分类

Caffe学习——Imagenet分类 1. Caffe安装 参考Alten Li的Caffe安装[1]。 2. Imagenet分类 代码来自Caffe的Notebook Examples[2]。在导入Caffe前,先在sys.path中插入Caffe的路径:examples文件夹下有子文件...

2015-12-19 21:09:46

阅读数 3920

评论数 1

原创 立体视觉——固定窗口的视差图计算

立体视觉——固定窗口的视差图计算 1. 视差图计算[1] 深度信息可以通过计算1幅图像和其它图像的特征位置的像素差获得。视差图和深度图很像,因为视差大的像素离摄像机近,而视差小的像素离摄像机远。按以米为单位来计算摄像机距物体多远需要额外的计算。 根据Matlab教程,计算视差图的标准方法是...

2015-11-22 23:44:01

阅读数 11198

评论数 7

原创 Torch学习——有监督学习

Torch学习——有监督学习 1. 街拍房间号数据集(SVHN) SVHN是对数据预处理和形式要求最小的现实图像集。和MNIST相似,但插入更多有标签数据并且来自1个更加困难,未解决的现实问题(识别自然场景图像中的数字)。SHVN来自谷歌街景图片。 (1)简介 a. 10类:每类为1个数字,数字1...

2015-11-14 11:43:11

阅读数 2062

评论数 0

原创 Torch学习——使用CUDA

Torch学习——使用CUDA 1. CUDA安装 CUDA在Ubuntu下的安装[1]还是很方便的。

2015-11-12 19:46:21

阅读数 7803

评论数 0

原创 Torch学习——开始

Torch学习——开始 1. 深度学习框架 到目前为止出现了各种各样的深度学习的解决方案框架,其中包括Caffe,CUDA convnet,Pylearn2,Theano,Torch以及TensorFlow等。Caffe和CUDA convnet没用过,不过一直很火的样子,Pylearn2包含...

2015-11-10 21:55:06

阅读数 1088

评论数 0

原创 用于视觉识别的卷积神经网络

用于视觉识别的卷积神经网络 一.卷积神经网络(CNNs/ConvNets) 1.架构概述 a.1个卷积网络架构是一系列将图像体积转换成输出体积的层组成; b.层有不同的类型(CONV/FC/RELU/POOL是目前最受欢迎的); c.每层都通过1个可微函数接收1个3D体积且转换成1个输...

2015-10-18 23:20:01

阅读数 3052

评论数 0

原创 Galaxy Zoo Challenge解决方案小结

Galaxy Zoo Challenge解决方案小结 1.过拟合 如果不过拟合,说明你的网络不够大。模型过拟合问题缓和: (1)数据增强 (2)Dropout和权重归一化约束 (3)修改网络架构来增加参数共享 2.预处理和数据增强 a.剪裁和下采样 424*424的彩色图像裁剪成...

2015-10-17 15:31:52

阅读数 891

评论数 2

原创 Theano入门——卷积神经网络

Theano入门——卷积神经网络 1.卷积神经网络介绍 参考链接[1]和[3]。 2.Theano实现 (1)conv2d函数 2D卷积。 (2)dimshuffle(*pattern)函数 置换维度的序列。pattern的举例如下: ('x')->0维标量变为1...

2015-10-12 20:43:15

阅读数 3369

评论数 0

原创 Theano入门——神经网络

Theano入门——神经网络 1.神经网络介绍 参考链接(1)。 2.参数设置 (1)模型分层 (2)神经网络每层权重维度 (3)块大小 (4)学习率和动量学习率 (5)训练次数 3.代码实现 (1)权重初始化 w_h1,b_h1为神经网络第1层(输入层)的权重和偏置,输入层的输入节点...

2015-10-12 20:42:39

阅读数 1329

评论数 0

原创 Theano入门——Logistic回归

Theano入门——Logistic回归 1.Logistic回归介绍 参考链接(1)。 2.参数设置 (1)输入权重w 输入权重矩阵的维度需要设置,行图像的大小,列为标签one-hot编码后的大小,cifar-10共有10类,所以为10;mnist标签为0~9,也是10。 (2)学习率lear...

2015-10-09 17:26:52

阅读数 933

评论数 0

原创 Theano入门——CIFAR-10和CIFAR-100数据集

1.CIFAR-10数据集介绍 CIFAR-10数据集包含60000个32*32的彩色图像,共有10类。有50000个训练图像和10000个测试图像。 数据集分为5个训练块和1个测试块,每个块有10000个图像。测试块包含从每类随机选择的1000个图像。训练块以随机的顺序包含这些图像,但一些训练块...

2015-10-09 11:33:47

阅读数 25373

评论数 3

原创 Theano入门——MNIST数据库

Theano入门——MNIST数据库

2015-10-08 23:33:47

阅读数 3250

评论数 2

原创 Leap Motion Using Unity3D——环岛跑车篇

Leap Motion Using Unity3D——环岛跑车篇  一. Leap Motion简介         Leap Motion作为一款体感传感器,通过立体视觉捕捉红外图像信息并产生手掌在三维空间中的相关信息。下面会结合示例来说明Leap Motion采集的模型数据在跑车游戏中的应...

2015-06-30 21:37:37

阅读数 2383

评论数 0

原创 Arduino Mega 2560与Arduino Uno R3——nRF24L01通信

nRF24L01通信 1. nRF24L01通信简介 (1)nRF24L01通信经历        先说说小菜鸟蛋疼调试模块的经历吧~有可能某些人觉得没有必要写这篇文章,因为Arduino作为开源硬件,本身容易上手例程也很多,直接跑就可以判断是软件问题还是硬件问题了。如果真的这样简单就没有下文了,...

2015-04-18 21:15:12

阅读数 6043

评论数 6

原创 Unity 3D——虚拟场景中的飞行摄像头

虚拟场景中的飞行摄像头 1. 虚拟场景中的飞行摄像头简介         虚拟场景中的飞行摄像头是指在场景中运动的第一视角(嗯,应该好像大概是这个意思- -||)。这里我想说的重点内容不是如何去构建虚拟场景,而是如何让视角在场景中飞翔的思路。 2. 主要思路 (1)搭建虚拟场景(包括地形,...

2015-03-28 11:07:40

阅读数 2323

评论数 0

原创 OpenCV Using Python——基于SURF特征提取和金字塔LK光流法的单目视觉三维重建

基于SURF特征提取和金字塔Lucas-Kanade光流法的单目视觉三维重建 1. 单目视觉三维重建问题         在前面的文章中,笔者用SIFT提取特征后用radio测试剔除了匹配中异常的特征点,然后根据匹配合格的特征点计算基础矩阵和本征矩阵,对本征矩阵SVD分解来估计和构造透视矩阵,根据...

2015-03-16 20:50:10

阅读数 6724

评论数 8

原创 OpenCV Using Python——单目视觉三维重建

单目视觉三维重建 1. 单目视觉三维重建简介         单目视觉三维重建是根据单个摄像头的运动模拟双目视觉获得物体在空间中的三维视觉信息。已知单个摄像头在两个不同时间点上同时在空间中两个不同位置的图像等价于已知两个摄像头同一时间在空间两个不同位置的图像。所以问题分解为: (1)如何用单...

2015-03-11 08:40:32

阅读数 18899

评论数 41

原创 OpenCV Using Python——调整基于HAAR特征的AdaBoost级联分类器的物体识别的参数

调整基于HAAR特征的AdaBoost级联分类器的物体识别的参数 1. 基于HAAR特征的AdaBoost级联分类器的物体识别问题         Paul A. Viola和Michael J. Jones在2001年发表文章“使用简单特征的提高级联检测器的快速物体检测”。同时CSDN上很多...

2015-03-07 10:34:16

阅读数 6909

评论数 1

原创 OpenCV Using Python——构造方向可控金字塔

构造方向可控金字塔 1. 方向可控金字塔简介        Willian T. Freeman等1991年提出方向可控金字塔。和高斯金字塔或拉普拉斯金字塔相比,方向金字塔除了分解尺度子带以外,还会分解方向子带。为什么需要用方向子带呢?因为在图像匹配等应用场合中,尺度变化外加旋转操作计算量很大。微...

2015-03-04 19:25:09

阅读数 2249

评论数 0

提示
确定要删除当前文章?
取消 删除