2018年07月_小熊猫Q

12月 11月 10月 09月 08月 07月

原创 yolo应用（一）--YOLO算法框架的简单使用

YOLO即You Only Look Once,，是检测Pascal VOC（http://host.robots.ox.ac.uk:8080/pascal/VOC/）2012数据集内对象/目标的系统，能够检测出20种Pascal对象：YOLO官方框架使用C写的，性能杠杠的，YOLO算法，我就不做过多介绍了。这次笔记先简单介绍一下这个框架如何使用。这里默认是yolo2，yolo1接近...

2018-07-28 15:38:30 12992 1

原创 caffe学习笔记（十七）--用caffemodel进行批量图片分类

接上篇文章，这次进行批量图片处理，在/examles/images文件中有四张图片如下所示接下来另外创建classifiy2.py文件，进行批量图片处理，事实上，这次的处理流程和上篇笔记基本类似，上次是处理一张图片，这次是处理批量图片而已。区别只是选用Python进行图片分类时调用的不是classify文件而是classify2文件，其他操作流程基本不变，具体可参考：学习笔记（十六）：h...

2018-07-27 18:29:46 1400

原创 caffe学习笔记（十六）--用caffemodel进行图片分类

部分内容参考博客：http://www.cnblogs.com/denny402/p/5111018.htmlcaffe程序自带一些检测图片，存放路径为caffe根目录下的 examples/images/cat.jpg, 如果我们想用一个训练好的caffemodel来对这张图片进行分类，那该怎么办呢？开发caffe的贾大牛团队，利用imagenet图片和caffenet模型训练好了一个c...

2018-07-27 18:20:07 3419

原创 caffe学习笔记（十五）--计算图片数据的均值

图片减去均值后，再进行训练和测试，会提高速度和精度。因此，一般在各种模型中都会有这个操作。那么这个均值怎么来的呢，实际上就是计算所有训练样本的平均值，计算出来后，保存为一个均值文件，在以后的测试中，就可以直接使用这个均值来相减，而不需要对测试图片重新计算。一、二进制格式的均值计算caffe中使用的均值数据格式是binaryproto, 作者为我们提供了一个计算均值的文件compute...

2018-07-27 07:26:17 359

原创 caffe学习笔记（十四）--图像数据转换成db（leveldb/lmdb)文件

在深度学习的实际应用中，我们经常用到的原始数据是图片文件，如jpg,jpeg,png,tif等格式的，而且有可能图片的大小还不一致。而在caffe中经常使用的数据类型是lmdb或leveldb，因此就产生了这样的一个问题：如何从原始图片文件转换成caffe中能够运行的db（leveldb/lmdb)文件？在caffe中，作者为我们提供了这样一个文件：convert_imageset.cpp，存...

2018-07-27 07:19:45 387

原创 caffe学习笔记（十三）--绘制网络结构图

小编推荐两种方法绘制深度学习的网络结构图。方法一通过Netscope具体网址为http://ethereon.github.io/netscope/#/editorPS:在Linux系统可以正常打开，在Windows系统可能需要翻墙。。打开后界面如图 # Enter your network definition here. 在这里输入你的网络定...

2018-07-27 07:18:36 3344

原创 caffe学习笔记（七）--视觉层及参数

所有的层都具有的参数，如name, type, bottom, top和transform_param请参看我的前一篇caffe学习笔记本文只讲解视觉层（Vision Layers)的参数，视觉层包括Convolution, Pooling, Local Response Normalization (LRN), im2col等层。1、Convolution层：就是卷积层，是卷积神经网...

2018-07-26 10:19:46 356

原创深度学习笔记（十）--深度神经网络的致命问题

随着神经网络层数的加深，有三个重大问题：一是非凸优化问题，即优化函数越来越容易陷入局部最优解；二是（Gradient Vanish）梯度消失问题；三是过拟合问题。1、非凸优化问题线性回归，本质是一个多元一次函数的优化问题，设f(x,y)=x+y多层神经网络，本质是一个多元K次函数优化问题，设f(x,y)=xy在线性回归当中，从任意一个点出发搜索，最终必然是下降到全局最小值...

2018-07-26 10:01:00 5569 1

原创深度学习笔记（九）--激活函数

激活函数是为了给神经元引入非线性因素，使得神经网络可以逼近任意非线性函数，这样神经网络就可以应用于众多的非线性模型中。常见的几个激活函数有sigmod，Tanh，ReLU，softmax1、sigmod函数（logistic 函数）下图为对应的公式和曲线以及对应的求导曲线图：取值范围（0，1），可以用来做二分类。不过这个函数现在已经很少用了，主要原因是其在反向传播（BP）算法...

2018-07-26 09:49:14 673 1

原创深度学习笔记（九）--CNN详述

CNN即Convolutional Neural Networks即卷积神经网络，是一种多层神经网络，擅长处理图像特别是大图像的相关机器学习问题。卷积神经网络通过一系列方法，成功将数据量庞大的图像识别问题不断降维，最终使其能够被训练。CNN最早由Yann LeCun提出并应用在手写字体识别上（MINST）。LeCun提出的网络称为LeNet，其网络结构如下：可以看出，CNN中主要有两种...

2018-07-26 09:34:54 1269

原创深度学习笔记（八）：目标检测性能评价指标（mAP、IOU..）

一、mAP　　这里首先介绍几个常见的模型评价术语，现在假设我们的分类目标只有两类，计为正例（positive）和负例（negtive）分别是：　　1）True positives(TP): 被正确地划分为正例的个数，即实际为正例且被分类器划分为正例的实例数（样本数）；　　2）False positives(FP): 被错误地划分为正例的个数，即实际为负例但被分类器划分为正例的实例数；...

2018-07-26 09:11:07 52614 14

原创 caffe学习笔记（五）：运行cifar实例

cifar10数据训练样本50000张，测试样本10000张，每张为32*32的彩色三通道图片，共分为10类。下载数据：sudo sh data/cifar10/get_cifar10.sh运行成功后，会在 data/cifar10/文件夹下生成一堆bin文件转换数据格式为lmdb：sudo sh examples/cifar10/create_cifar10.sh转换...

2018-07-25 20:18:34 438

原创深度学习笔记（七）--ResNet（残差网络）

内容来自吴恩达老师视频，网易云课堂有哦ResNets非常非常深的神经网络是很难训练的，因为存在梯度消失和梯度爆炸问题。ResNets是由残差块（Residual block）构建的，首先解释一下什么是残差块。这是一个两层神经网络，在层进行激活，得到，再次进行激活，两层之后得到。计算过程是从开始，首先进行线性激活，根据这个公式：，通过算出，即乘以权重矩阵，再加上偏差因...

2018-07-25 17:54:23 108006 27

原创深度学习笔记（六）--VGG16网络

内容来自吴恩达老师视频哦，网易云课堂有哦VGG-16VGG，也叫作VGG-16网络。值得注意的一点是，VGG-16网络没有那么多超参数，这是一种只需要专注于构建卷积层的简单网络。首先用3×3，步幅为1的过滤器构建卷积层，padding参数为same卷积中的参数。然后用一个2×2，步幅为2的过滤器构建最大池化层。因此VGG网络的一大优点是它确实简化了神经网络结构，下面我们具体讲讲这种网络结构...

2018-07-25 17:44:12 44575 8

原创深度学习笔记（五）--AlexNet网络

AlexNet神经网络AlexNet，是以论文的第一作者Alex Krizhevsky的名字命名的，另外两位合著者是Ilya Sutskever和Geoffery Hinton。 AlexNet首先用一张227×227×3的图片作为输入，实际上原文中使用的图像是224×224×3，但是如果你尝试去推导一下，你会发现227×227这个尺寸更好一些。第一层我们使用96个11×11的过滤器，...

2018-07-25 17:37:22 714

原创深度学习笔记（四）--LeNet-5网络

类 LeNet-5卷积运算网络实例假设，有一张大小为32×32×3的输入图片，这是一张RGB模式的图片，你想做手写体数字识别。32×32×3的RGB图片中含有某个数字，比如7，你想识别它是从0-9这10个数字中的哪一个，我们构建一个神经网络来实现这个功能。LeNet-5是多年前Yann LeCun创建的，此例子采用的模型并不是LeNet-5，但是受它启发，许多参数选择都与LeNet-5...

2018-07-25 17:28:40 807 2

原创深度学习笔记（三）--目标检测算法综述

目前目标检测领域的深度学习方法主要分为两类：two stage的目标检测算法；one stage的目标检测算法。前者是先由算法生成一系列作为样本的候选框，再通过卷积神经网络进行样本分类；后者则不用产生候选框，直接将目标边框定位的问题转化为回归问题处理。正是由于两种方法的差异，在性能上也有不同，前者在检测准确率和定位精度上占优，后者在算法速度上占优。相对于R-CNN系列的"看两眼"(候选框提取与...

2018-07-25 16:39:01 18002

原创 CNN经典分类模型--AlexNet、VGG16、ResNet网络结构图

AlexNet网络结构图VGG16网络结构图ResNet网络结构图

2018-07-25 10:21:30 17189 4

原创深度学习笔记（二）：DL资料汇总

吴恩达机器学习、深度学习笔记：百度云https://pan.baidu.com/s/1l5q5BUXBG4CGAM4TlkVtoQ 密码：hvo2注：此笔记为黄博主持编写、整理，小编只是借花献佛。另外网易云课堂有对应视频教程，地址如下：http://mooc.study.163.com/smartSpec/detail/1001319001.htm台大李宏毅教授的一天搞懂深度学习P...

2018-07-24 16:24:14 1187

原创深度学习笔记（一）：图像理解的三个层次

deep learning 简称DL,小编刚接触计算机视觉利用深度学习进行图像处理，先普及一下对图像进行处理的三个层次。一是分类（classification）即是将图像结构化为某一类别的信息，用事先确定好的类别（string）或实例ID来描述图片。其中ImageNet是最权威的测评集，每年的ILSVRC催生大量优秀的深度网络结构，为其他任务提供基础，在应用领域，人脸、场景识别都可以视为分...

2018-07-24 15:58:03 10148

原创 caffe学习笔记（三）：资料分享

caffe官方教程网址：http://caffe.berkeleyvision.org/包含caffe必修的基础知识和实例解析，很不错的自学资料，另外推荐由caffeCN社区翻译的caffe官方教程中文版，附上百度云分享链接（失效可在评论区留言，博主看到后随时更新）：链接：https://pan.baidu.com/s/1Ry_dTkhlyleXMXugX0KfMA 密码：22ni另外...

2018-07-24 15:38:37 554

原创 caffe学习笔记（二）：Mnist手写体数字识别实例

手写体识别基本是caffe入门的必修课，caffe官方教程最为正宗，在此给出官方教程链接：http://caffe.berkeleyvision.org/gathered/examples/mnist.html另外有大神已经进行了详细翻译，在此附上链接，就不再进行重复编写。https://blog.csdn.net/real_myth/article/details/52743407另外为...

2018-07-24 15:19:26 1086

原创 caffe学习笔记（一）: caffe训练流程(超详细)

一、准备数据1.得到文件列表清单 2.转换成Lmdb格式在caffe中经常使用的数据类型是lmdb或leveldb，因此需要将原始图片文件转化为能够运行的db文件。在caffe中存在convert_imageset.cpp，存放在根目录下的tools文件夹下。编译之后，生成对应的可执行文件放在 buile/tools/ 下面，这个文件的...

2018-07-24 15:05:19 15531 2

原创 YOLOv2论文笔记

升级版 YOLO v2为提高物体定位精准性和召回率，YOLO作者提出了《YOLO9000: Better, Faster, Stronger》 (Joseph Redmon, Ali Farhadi, CVPR 2017, Best Paper Honorable Mention)，相比v1提高了训练图像的分辨率；引入了faster rcnn中anchor box的思想，对网络结构的设计进行...

2018-07-24 09:19:55 7035 2

原创 YOLOv1论文笔记

目前目标检测领域的深度学习算法主要分为两类：two stage的目标检测算法，以R-CNN系列为代表；one stage 的目标检测算法，以YOLO系列为代表。前者是先由算法生成一系列的样本候选框，再通过卷积神经网络进行样本分类；而后者直接将目标边框定位问题转化为回归问题进行处理。前者在检测准确率和定位精度上占优，后者在算法速度上具有很大优势。相对于R-CNN系列的看两眼（候选框提取与分类）...

2018-07-24 09:09:04 2499 3

服务器基础知识全解，高清汇总版PPT

2023-10-31

服务器基础知识手册PPT

服务器基础知识手册，包括服务器整体结构的介绍，如CPU、内存、磁盘、Raid卡等组成部门的介绍及整体介绍

2023-10-30

基于深度学习的目标检测算法综述.xmind

此PDF为小编对整理的思维导图文件生成的源文件，总结了深度学习以及CNN火热后，目标检测相关算法的总览，其中还包含在19年轮回重生的anchor-free等算法，算是一个算法概述。

2019-08-25

基于深度学习的目标检测算法总览pdf文件.pdf

此PDF为小编对整理的思维导图文件生成，总结了深度学习以及CNN火热后，目标检测相关算法的总览，其中还包含在19年轮回重生的anchor-free等算法，算是一个算法概述。

2019-08-25

Anchor机制解读.pdf

针对目标检测中基于anchor机制进行解读的PDF文件，包括其优缺点总结。

2019-06-05

目标检测改进点.pdf

针对CVPR2019及之前目标检测相关论文所进行的目标检测算法有关改进点的汇总，包括IOU改进、NMS改进、anchor-free等

2019-06-05

基于深度学习的目标检测算法总览.pdf

2019-06-04

PyTorch 模型训练实用教程

本教程内容主要为在 PyTorch 中训练一个模型所可能涉及到的方法及函数，并且对 PyTorch 提供的数据增强方法（22 个）、权值初始化方法（10 个）、损失函数（17 个）、优化器（6 个）及 tensorboardX 的方法（13 个）进行了详细介绍，本教程分为四章，结构与机器学习三大部分一致。第一章，介绍数据的划分，预处理，数据增强；第二章，介绍模型的定义，权值初始化，模型 Finetune；第三章，介绍各种损失函数及优化器；第四章，介绍可视化工具，用于监控数据、模型权及损失函数的变化。

2019-03-03

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

服务器基础知识全解，高清汇总版PPT

服务器基础知识手册PPT

基于深度学习的目标检测算法综述.xmind

基于深度学习的目标检测算法总览pdf文件.pdf

Anchor机制解读.pdf

目标检测改进点.pdf

基于深度学习的目标检测算法总览.pdf

PyTorch 模型训练实用教程

吴恩达机器学习聚类+无监督学习课后题汇总【带答案解析】

吴恩达深度学习选择题（带解析）

吴恩达机器学习选择题（带解析）

单图像去雾算法AOD-Net实现【代码+paper+PPT】

李宏毅【课件PPT】

树莓派新手手册

反卷积论文汇总

caffe安装教程

SSD论文翻译

Python 深度学习

MobileNet论文翻译

caffenet.model 均值文件

bvlc_reference_caffenet.caffemodel

python入门笔记

传统方法目标识别 代码

基本图像处理代码

YOLO系列论文翻译

目标检测算法笔记

caffe学习笔记

caffe学习教程

空空如也

传统方法目标识别代码