cs231n学习笔记
Tra_cy
这个作者很懒,什么都没留下…
展开
-
对卷积神经网络中卷积层、激活层、池化层、全连接层的理解
文章目录卷积神经网络输入层卷积层激励层池化层全连接层卷积神经网络举一个卷积神经网络识别汽车的例子如下:其中数据输入的是一张图片(输入层),CONV表示卷积层,RELU表示激励层,POOL表示池化层,Fc表示全连接层。输入层在图片输入到神经网络之前,一般在输入层进行图像处理,有以下三种常见的图像处理的方式:均值化:把输入数据各个维度都中心化到0,所有样本求和求平均,然后用所有的样本减...原创 2019-12-15 11:20:15 · 6397 阅读 · 0 评论 -
【cs231n】lecture 9 CNN Architectures
文章目录AlexNetZFNetVGGNet这个专题主要介绍的是几种典型的CNN架构。AlexNet输入:227*227*3的图像矩阵。第一层(CONV1):96个步长为4,大小为11*11的卷积核,经过第一层后的输出大小为55*55*96,参数个数为11*11*3*96。第二层(POOL1):3*3的卷积核,步长为2,输出大小为27*27*96,池化层没有参数。ZFNet和Al...原创 2019-11-09 11:55:56 · 939 阅读 · 0 评论 -
【cs231n】lecture 8 Deep Learning Software
文章目录CPU vs GPUCPU vs GPUGPU(Graphics Processing Unit图形处理单元),最初用于渲染计算机图形。相同点:GPU和CPU都是一种通用的计算机器,可以执行程序和指令。不同点:GPU单个核的运行速度比CPU慢,执行的操作也没有CPU多,GPU的单个核无法独立完成工作,他们需要共同协作,多个GPU的核共同执行同一项任务。CPU有cache,但是...原创 2019-11-05 18:35:40 · 154 阅读 · 0 评论 -
【cs231n】lecture 6 Training Neural Networks(上)
文章目录Part 1Activation Functions(激活函数)SigmoidtanhReLULeaky ReLUPReLUData Preprocessing(数据预处理)Weight Initialization(权重初始化)Batch Normalization(批量归一化)Badysitting the Learning Process(训练过程监控)Hyperparameter ...原创 2019-10-29 10:25:55 · 338 阅读 · 0 评论 -
【cs231n】lecture 5 Convolutional Neural Network
文章目录卷积和池化视觉之外的卷积神经网络卷积和池化Fully Connected Layer(全连接层):上图中,输入为一张32323(展开即为3072的向量)的图片,和权值W进行点积,输出10个得分。Convolution Layer(卷积层):卷积层和全连接层的区别是可以保全空间结构,输入32323的图片。不展开为一个长向量的形式,即可保存图片的结构。权重是一些小的卷积核,将卷积...原创 2019-10-25 16:09:52 · 191 阅读 · 0 评论 -
【cs231n】lecture4 Backpropagation and Neural Network
文章目录反向传播反向传播本节内容:如何计算任何复杂函数的解析梯度,需要用到一个计算图的框架。计算图:用图来表示任何函数,图中的节点表示我们要执行的每一步计算。例如下图:输入x和W,进行矩阵相乘得到一个得分向量,通过hinge loss计算Li,R计算一个正则项,最后的L是损失项和数据项的和。利用计算图进行Backpropagation:反向传播是链式法则的递归调用。第一步计算正向传播...原创 2019-10-23 09:34:48 · 194 阅读 · 0 评论 -
【cs231n】lecture 3损失函数和优化
文章目录3.1 损失函数3.1 损失函数损失函数的概念理解:图一,在线性分类中,W的每一行对应一个分类模板,它给出图片所属类别的可能的得分,得分越高说明该图片中的物体属于这一类别的可能性越大,因此我们需要选择一个分类效果最优的W,W来自于数据集的训练。损失函数就是用来度量某个W好坏的,输入为W,得到一个得分,定量地估计W的好坏,这个函数即为损失函数。数学公式表示:上图中第一个公式为...原创 2019-10-19 18:53:45 · 417 阅读 · 0 评论 -
【cs231n】lecture2 图像分类,数据驱动方法
工具:Python+Numpy学习参考:http://cs231n.github.io/python-numpy-tutorial/2.1 数据驱动方法语意鸿沟:数据驱动方法:获取大量图片数据集和标签使用机器学习来训练一个分类器识别程序接口API:最邻近分类器最临近算法:在训练集中找到最接近的示例(样本),这些样本来自训练集,所以这些最接近示例的标签已知。如何比较两张图片?...原创 2019-10-17 15:02:53 · 191 阅读 · 0 评论 -
【cs231n】lecture1
【cs231n】lecture1深度学习的发展ImageNetLarge Scale Visual Recognition Challenge(大规模视觉识别竞赛)卷积神经网络深度学习的发展ImageNetImageNet项目是一个用于视觉对象识别软件研究的大型可视化数据库。ImageNet由将近1400万多的图片,分为22000类的物体或场景。Large Scale Visual Rec...原创 2019-10-14 02:00:08 · 170 阅读 · 0 评论