- 博客(25)
- 资源 (26)
- 收藏
- 关注
原创 yolo应用(一)--YOLO算法框架的简单使用
YOLO即You Only Look Once,,是检测Pascal VOC(http://host.robots.ox.ac.uk:8080/pascal/VOC/)2012数据集内对象/目标的系统,能够检测出20种Pascal对象:YOLO官方框架使用C写的,性能杠杠的,YOLO算法,我就不做过多介绍了。这次笔记先简单介绍一下这个框架如何使用。这里默认是yolo2,yolo1接近...
2018-07-28 15:38:30 12992 1
原创 caffe学习笔记(十七)--用caffemodel进行批量图片分类
接上篇文章,这次进行批量图片处理,在/examles/images文件中有四张图片如下所示接下来另外创建classifiy2.py文件,进行批量图片处理,事实上,这次的处理流程和上篇笔记基本类似,上次是处理一张图片,这次是处理批量图片而已。区别只是选用Python进行图片分类时调用的不是classify文件而是classify2文件,其他操作流程基本不变,具体可参考:学习笔记(十六) :h...
2018-07-27 18:29:46 1400
原创 caffe学习笔记(十六)--用caffemodel进行图片分类
部分内容参考博客:http://www.cnblogs.com/denny402/p/5111018.htmlcaffe程序自带一些检测图片,存放路径为caffe根目录下的 examples/images/cat.jpg, 如果我们想用一个训练好的caffemodel来对这张图片进行分类,那该怎么办呢?开发caffe的贾大牛团队,利用imagenet图片和caffenet模型训练好了一个c...
2018-07-27 18:20:07 3419
原创 caffe学习笔记(十五)--计算图片数据的均值
图片减去均值后,再进行训练和测试,会提高速度和精度。因此,一般在各种模型中都会有这个操作。那么这个均值怎么来的呢,实际上就是计算所有训练样本的平均值,计算出来后,保存为一个均值文件,在以后的测试中,就可以直接使用这个均值来相减,而不需要对测试图片重新计算。一、二进制格式的均值计算caffe中使用的均值数据格式是binaryproto, 作者为我们提供了一个计算均值的文件compute...
2018-07-27 07:26:17 359
原创 caffe学习笔记(十四)--图像数据转换成db(leveldb/lmdb)文件
在深度学习的实际应用中,我们经常用到的原始数据是图片文件,如jpg,jpeg,png,tif等格式的,而且有可能图片的大小还不一致。而在caffe中经常使用的数据类型是lmdb或leveldb,因此就产生了这样的一个问题:如何从原始图片文件转换成caffe中能够运行的db(leveldb/lmdb)文件?在caffe中,作者为我们提供了这样一个文件:convert_imageset.cpp,存...
2018-07-27 07:19:45 387
原创 caffe学习笔记(十三)--绘制网络结构图
小编推荐两种方法绘制深度学习的网络结构图。方法一 通过Netscope具体网址为http://ethereon.github.io/netscope/#/editorPS:在Linux系统可以正常打开,在Windows系统可能需要翻墙。。打开后界面如图 # Enter your network definition here. 在这里输入你的网络定...
2018-07-27 07:18:36 3344
原创 caffe学习笔记(七)--视觉层及参数
所有的层都具有的参数,如name, type, bottom, top和transform_param请参看我的前一篇caffe学习笔记本文只讲解视觉层(Vision Layers)的参数,视觉层包括Convolution, Pooling, Local Response Normalization (LRN), im2col等层。1、Convolution层:就是卷积层,是卷积神经网...
2018-07-26 10:19:46 356
原创 深度学习笔记(十)--深度神经网络的致命问题
随着神经网络层数的加深,有三个重大问题:一是非凸优化问题,即优化函数越来越容易陷入局部最优解;二是(Gradient Vanish)梯度消失问题;三是过拟合问题。1、 非凸优化问题线性回归,本质是一个多元一次函数的优化问题,设f(x,y)=x+y多层神经网络,本质是一个多元K次函数优化问题,设f(x,y)=xy在线性回归当中,从任意一个点出发搜索,最终必然是下降到全局最小值...
2018-07-26 10:01:00 5569 1
原创 深度学习笔记(九)--激活函数
激活函数是为了给神经元引入非线性因素,使得神经网络可以逼近任意非线性函数,这样神经网络就可以应用于众多的非线性模型中。常见的几个激活函数有sigmod,Tanh,ReLU,softmax1、sigmod函数(logistic 函数)下图为对应的公式和曲线以及对应的求导曲线图:取值范围(0,1),可以用来做二分类。不过这个函数现在已经很少用了 ,主要原因是其在反向传播(BP)算法...
2018-07-26 09:49:14 673 1
原创 深度学习笔记(九)--CNN详述
CNN即Convolutional Neural Networks即卷积神经网络,是一种多层神经网络,擅长处理图像特别是大图像的相关机器学习问题。卷积神经网络通过一系列方法,成功将数据量庞大的图像识别问题不断降维,最终使其能够被训练。CNN最早由Yann LeCun提出并应用在手写字体识别上(MINST)。LeCun提出的网络称为LeNet,其网络结构如下:可以看出,CNN中主要有两种...
2018-07-26 09:34:54 1269
原创 深度学习笔记(八):目标检测性能评价指标(mAP、IOU..)
一、mAP 这里首先介绍几个常见的模型评价术语,现在假设我们的分类目标只有两类,计为正例(positive)和负例(negtive)分别是: 1)True positives(TP): 被正确地划分为正例的个数,即实际为正例且被分类器划分为正例的实例数(样本数); 2)False positives(FP): 被错误地划分为正例的个数,即实际为负例但被分类器划分为正例的实例数;...
2018-07-26 09:11:07 52614 14
原创 caffe学习笔记(五):运行cifar实例
cifar10数据训练样本50000张,测试样本10000张,每张为32*32的彩色三通道图片,共分为10类。下载数据:sudo sh data/cifar10/get_cifar10.sh运行成功后,会在 data/cifar10/文件夹下生成一堆bin文件转换数据格式为lmdb:sudo sh examples/cifar10/create_cifar10.sh转换...
2018-07-25 20:18:34 438
原创 深度学习笔记(七)--ResNet(残差网络)
内容来自吴恩达老师视频,网易云课堂有哦ResNets非常非常深的神经网络是很难训练的,因为存在梯度消失和梯度爆炸问题。ResNets是由残差块(Residual block)构建的,首先解释一下什么是残差块。这是一个两层神经网络,在 层进行激活,得到 ,再次进行激活,两层之后得到 。计算过程是从 开始,首先进行线性激活,根据这个公式: ,通过 算出 ,即 乘以权重矩阵,再加上偏差因...
2018-07-25 17:54:23 108006 27
原创 深度学习笔记(六)--VGG16网络
内容来自吴恩达老师视频哦,网易云课堂有哦VGG-16VGG,也叫作VGG-16网络。值得注意的一点是,VGG-16网络没有那么多超参数,这是一种只需要专注于构建卷积层的简单网络。首先用3×3,步幅为1的过滤器构建卷积层,padding参数为same卷积中的参数。然后用一个2×2,步幅为2的过滤器构建最大池化层。因此VGG网络的一大优点是它确实简化了神经网络结构,下面我们具体讲讲这种网络结构...
2018-07-25 17:44:12 44575 8
原创 深度学习笔记(五)--AlexNet网络
AlexNet神经网络AlexNet,是以论文的第一作者Alex Krizhevsky的名字命名的,另外两位合著者是Ilya Sutskever和Geoffery Hinton。 AlexNet首先用一张227×227×3的图片作为输入,实际上原文中使用的图像是224×224×3,但是如果你尝试去推导一下,你会发现227×227这个尺寸更好一些。第一层我们使用96个11×11的过滤器,...
2018-07-25 17:37:22 714
原创 深度学习笔记(四)--LeNet-5网络
类 LeNet-5卷积运算网络实例假设,有一张大小为32×32×3的输入图片,这是一张RGB模式的图片,你想做手写体数字识别。32×32×3的RGB图片中含有某个数字,比如7,你想识别它是从0-9这10个数字中的哪一个,我们构建一个神经网络来实现这个功能。LeNet-5是多年前Yann LeCun创建的,此例子采用的模型并不是LeNet-5,但是受它启发,许多参数选择都与LeNet-5...
2018-07-25 17:28:40 807 2
原创 深度学习笔记(三)--目标检测算法综述
目前目标检测领域的深度学习方法主要分为两类:two stage的目标检测算法;one stage的目标检测算法。前者是先由算法生成一系列作为样本的候选框,再通过卷积神经网络进行样本分类;后者则不用产生候选框,直接将目标边框定位的问题转化为回归问题处理。正是由于两种方法的差异,在性能上也有不同,前者在检测准确率和定位精度上占优,后者在算法速度上占优。相对于R-CNN系列的"看两眼"(候选框提取与...
2018-07-25 16:39:01 18002
原创 CNN经典分类模型--AlexNet、VGG16、ResNet网络结构图
AlexNet网络结构图VGG16网络结构图ResNet网络结构图
2018-07-25 10:21:30 17189 4
原创 深度学习笔记(二):DL资料汇总
吴恩达机器学习、深度学习笔记:百度云https://pan.baidu.com/s/1l5q5BUXBG4CGAM4TlkVtoQ 密码:hvo2注:此笔记为黄博主持编写、整理,小编只是借花献佛。另外网易云课堂有对应视频教程,地址如下:http://mooc.study.163.com/smartSpec/detail/1001319001.htm台大李宏毅教授的一天搞懂深度学习P...
2018-07-24 16:24:14 1187
原创 深度学习笔记(一):图像理解的三个层次
deep learning 简称DL,小编刚接触计算机视觉利用深度学习进行图像处理,先普及一下对图像进行处理的三个层次。一是分类(classification)即是将图像结构化为某一类别的信息,用事先确定好的类别(string)或实例ID来描述图片。其中ImageNet是最权威的测评集,每年的ILSVRC催生大量优秀的深度网络结构,为其他任务提供基础,在应用领域,人脸、场景识别都可以视为分...
2018-07-24 15:58:03 10148
原创 caffe学习笔记(三):资料分享
caffe官方教程网址:http://caffe.berkeleyvision.org/包含caffe必修的基础知识和实例解析,很不错的自学资料,另外推荐由caffeCN社区翻译的caffe官方教程中文版,附上百度云分享链接(失效可在评论区留言,博主看到后随时更新):链接:https://pan.baidu.com/s/1Ry_dTkhlyleXMXugX0KfMA 密码:22ni另外...
2018-07-24 15:38:37 554
原创 caffe学习笔记(二):Mnist手写体数字识别实例
手写体识别基本是caffe入门的必修课,caffe官方教程最为正宗,在此给出官方教程链接:http://caffe.berkeleyvision.org/gathered/examples/mnist.html另外有大神已经进行了详细翻译,在此附上链接,就不再进行重复编写。https://blog.csdn.net/real_myth/article/details/52743407另外为...
2018-07-24 15:19:26 1086
原创 caffe学习笔记(一): caffe训练流程(超详细)
一、准备数据1.得到文件列表清单 2.转换成Lmdb格式在caffe中经常使用的数据类型是lmdb或leveldb,因此需要将原始图片文件转化为能够运行的db文件。在caffe中存在convert_imageset.cpp,存放在根目录下的tools文件夹下。编译之后,生成对应的可执行文件放在 buile/tools/ 下面,这个文件的...
2018-07-24 15:05:19 15531 2
原创 YOLOv2论文笔记
升级版 YOLO v2为提高物体定位精准性和召回率,YOLO作者提出了 《YOLO9000: Better, Faster, Stronger》 (Joseph Redmon, Ali Farhadi, CVPR 2017, Best Paper Honorable Mention),相比v1提高了训练图像的分辨率;引入了faster rcnn中anchor box的思想,对网络结构的设计进行...
2018-07-24 09:19:55 7035 2
原创 YOLOv1论文笔记
目前目标检测领域的深度学习算法主要分为两类:two stage的目标检测算法,以R-CNN系列为代表;one stage 的目标检测算法,以YOLO系列为代表。前者是先由算法生成一系列的样本候选框,再通过卷积神经网络进行样本分类;而后者直接将目标边框定位问题转化为回归问题进行处理。前者在检测准确率和定位精度上占优,后者在算法速度上具有很大优势。相对于R-CNN系列的看两眼(候选框提取与分类)...
2018-07-24 09:09:04 2499 3
基于深度学习的目标检测算法综述.xmind
2019-08-25
基于深度学习的目标检测算法总览pdf文件.pdf
2019-08-25
基于深度学习的目标检测算法总览.pdf
2019-06-04
PyTorch 模型训练实用教程
2019-03-03
吴恩达深度学习选择题(带解析)
2018-12-25
单图像去雾算法AOD-Net实现【代码+paper+PPT】
2018-12-07
李宏毅【课件PPT】
2018-12-07
反卷积论文汇总
2018-08-17
Python 深度学习
2018-08-17
caffenet.model 均值文件
2018-07-27
bvlc_reference_caffenet.caffemodel
2018-07-27
传统方法目标识别 代码
2018-07-25
caffe学习笔记
2018-07-25
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人