2019年02月_小小小绿叶

原创目标检测进阶二(Yolo算法)

假设你的输入图像是100✖100的，然后再图像上放一个网格。为了简单这里放置了3✖3的网格（实际实现时会更加精细）。YOLO算法基本思路是：使用图像分类和定位算法（之前博客中介绍过），然后将算法应用到9个格子上。更具体一点，需要这样定义训练标签，对于9个格子中的每一个，指定一个标签y，y是8维向量，即Pc=0或1，表示格子中是否有图像，然后bx，by，bh，bw去表示（如果那个格子中有对象）边...

2019-02-20 20:33:35 1377 1

原创目标检测进阶一（窗口滑动卷积算法）

神经网络可以通过输出图片上特征点的（x，y）坐标来实现对目标特征的识别。假设你正在构建一个人脸识别应用，出于某种原因，你希望算法可以给出眼角的具体位置。眼角坐标为（x，y），你可以让神经网络的最后一层多输出两个数字lx和ly，作为眼角的坐标值。如果你想知道两只眼睛的四个眼角的具体位置，那么从左到右，依次用四个特征点来表示这四个眼角。对神经网络稍作一些修改，输出第一个特征点（l1x，l1y），第...

2019-02-20 12:00:55 3483

原创神经网络解决对象分类和定位问题

图像分类：即算法遍历图片，判断其中的对象是不是汽车定位分类问题：即用算法判断图中是否有汽车还要在图中标记出它的位置，用红色方框圈起来。图像分类，例如输入一张图片到多层卷积神经网络，它会输出一个特征向量并反馈给softmax来预测图片类型。如果还想定位图片中汽车的位置，该怎么做呢？我们可以让神经网络多输出几个单元，输出一个边界框（bounding box）。具体说就是让神经网络再多输出4个...

2019-02-19 19:55:14 2526

原创洞悉Inception网络结构

当我们构建卷积层时，你要决定过滤器的大小究竟是1✖1，3✖3，还是5✖5，或者要不要添加池化层。而Inception网络的作用就是代替你来做决定，虽然网络结构因此变得更加复杂，但网络表现却非常好。让我们来理解一下其中的原理。例如，这是28✖28✖192维度的输入层，Inception层的作用就是代替人工来确定卷积层中的过滤器类型或者确定是否需要创建卷积层或池化层。如果使用1✖1卷积，输出结果会...

2019-02-19 13:10:40 609

原创 1✖1的卷积在深度学习中的作用

首先我们举一个简单的例子。我们假设一个1✖1的卷积核，里面的数字为2。输入一张6✖6✖1的图片，然后对它做卷积，其过滤器大小为（卷积核）1✖1✖1。结果显而易见，即相当于把这个图片乘以数字2。用1✖1的过滤器进行卷积似乎用处不大。只是对输入矩阵乘以某个数字。但这仅仅是对于6✖6✖1的通道图片来说，1✖1卷积效果不佳。如果是一张6✖6✖32的图片，那么使用1✖1过滤器进行卷积效果更好。具体来说...

2019-02-19 10:18:09 1028

原创残差网络学习心得

残差网络学习心得残差网络介绍为什么残差网络有如此好的表现？残差网络介绍ResNets是由残差块构建的，首先先解释一下什么是残差块。这是一个两层神经网络在L层进行激活。计算过程是从a[l]开始，首先进行线性激活。根据这个等式，通过a[l]算出z[l+1]即a[l]乘以权重矩阵再加上偏差因子，然后通过非线性Relu激活得到a[l+1]。随后我们再进行线性激活，从下面等式可以得出z[l...

2019-02-18 20:32:24 28918 6

原创基于图像数据识别的卷积神经网络算法

cifar-10的图像数据是一个32*32*3的图像，里面一共有50000张图并分为10个类别。此次作业主要运用简单的卷积神经网络来对50000张图训练并选出1000张来预测。卷积神经网络与传统神经网络相比，多了卷积层，池化层，dropout，其目的就是减少参数的数量从而实现网络的深度，利用dropout等方法降低过拟合，最终达到传统神经网络无法比拟的预测效果。此次采用了简单的三层卷积...

2019-02-18 10:36:39 5344 2

litt1e的博客