2019年02月_Veropatrinica

原创 CNN笔记（CS231N）——强化学习（Reinforcement Learning）

强化学习我们之前讲了监督学习跟无监督学习，这一讲我们采用一种全新的思路来解决问题叫做强化学习。强化学习的目标是让代理学会采取动作来最大化奖励函数下面是强化学习的一些例子我们怎么样对这个问题进行建模呢？我们可以把这个问题看做一个马尔科夫链目标函数是从头到尾的奖励加权相加对于π是固定的，那么怎么解决随机性的问题呢？方案就是采用数学期望来平均这些随机性由于...

2019-02-24 10:30:21 2845

原创 CNN笔记（CS231N）——生成模型（Generative Models）

总览之前我们讲的网络模型都是监督学习，这一讲我们要讲的是无监督学习。以下是本讲的总览无监督学习与监督学习最大的不同就是我们只有数据，没有任何多余的标注，我们要做的就是学习数据中隐藏的某些结构。而生成模型就属于无监督学习的一种生成模型生成模型的目标是给定训练数据，希望能获得与训练数据相同的新数据样本。我们的目标是找到训练数据的分布函数生成模型在很多场景有非常好的应用...

2019-02-22 13:34:48 3624

原创 CNN笔记（CS231N）——网络可视化与理解（Visualizing and Understanding）

网络可视化与理解神经网络对于我们来说就像一个黑盒子，我们有一对输入输出就能对网络进行训练，而不知道内部究竟发生了什么，于是一些研究者开始研究网络内部究竟学习到了什么特征。以下就是一些常用的网络在第一层的卷积核，代表在输入图像中寻找类似的特征，例如边、角、特定方向的线等等由于网络第一层的卷积核深度是3维的，因此我们可以将其作为RGB图来看待，而对于深层的网络，卷积核深度不止是3维，那么我...

2019-02-14 22:11:33 1262

原创 CNN笔记（CS231N）——图像检测与图像分割（Detection and Segmentation）

图像检测与图像分割我们之前讲的都是图像分类的问题，在这一讲我们要介绍一些其他的计算机视觉中的问题，例如图像检测与图像分割。我们主要介绍一下四个部分：图像分割、分类+定位、多目标检测、多目标实例分割语义分类第一部分是语义分类。我们需要给每个像素都输出一个值，来代表这个像素属于某一个分类一种传统的方法就是用滑动窗口不断在输入图像上滑动，然后输出窗口中央的像素属于哪一类。这种方...

2019-02-14 15:24:00 2320

原创 CNN笔记（CS231N）——循环神经网络（Recurrent Neural Networks）

递归神经网络上一讲讲了CNN的架构，那么当我们把时间这个维度考虑进来了以后，我们就得到了递归神经网络（RNN）。RNN的输入输出可以是一对多、多对一、多对多，分别对应不同的应用场景RNN的核心部分是如下公式，旧状态+当前输入，经过一个函数，得到了新状态，新状态会被送到下一个时候参与运算。我们的这个函数fw在不同时间是固定的。普通RNN一般来说这个fw函数是tanh函数，W是...

2019-02-13 21:24:49 1145

原创 CNN笔记（CS231N）——CNN架构（CNN Architectures）

CNN架构这一讲主要介绍了一些常用的CNN架构，例如AlexNet、VGG、GoogleNet等AlexNetAlexNet是一个八层的卷积神经网络，它是第一个采用ReLU激励函数的神经网络由于当时内存限制，在这个网络中，同一卷积层被分为两个部分放在两个GPU中分别计算。在1、2、4、5层只计算本GPU中的特征图，在3、6、7、8层中将两个GPU中的特征图放在一起计算...

2019-02-11 20:01:33 1071

原创 CNN笔记（CS231N）——深度学习软件（Deep Learning Software）

深度学习框架我们在使用CNN的时候往往会采用深度学习框架来减小我们的工作量，以下是现在常用的一些深度学习框架深度学习框架有以下意义下面让我们来看看如果我们用numpy从头构建一个计算图是怎么样的，我们可以看出它有以下两个问题：不能在GPU上运行以及梯度需要我们手动计算我们采用深度学习的框架可以很好的解决以上问题：让程序在GPU上运行仅仅需要一行代码，以及程序可以自动为我...

2019-02-09 16:25:37 1491

原创 CNN笔记（CS231N）——训练神经网络II（Training Neural Networks, Part 2）

训练神经网络我们接着上一讲继续，这一讲主要讲的是优化、正则化与迁移学习高级优化我们首先来看看传统的随机梯度优化有什么问题，如果损失函数在一个维度上梯度比较小，在另一个维度上梯度比较大，那么这种情况下就会出现沿着梯度小的维度变化缓慢，另一个方向变化迅速，出现如下图这种震荡现象导致收敛缓慢除此以外就是局部最小值与驻点的问题，局部最小值在多维特征的情况下出现的几率比较小，最常见的是驻...

2019-02-01 10:46:16 402

shanwenkang的博客