高效计算基础与线性分类器

最新推荐文章于 2022-05-08 14:33:37 发布

心潇瑶

最新推荐文章于 2022-05-08 14:33:37 发布

阅读量1.5k

点赞数 2

分类专栏：深度学习笔记文章标签：深度学习线性分类器

本文链接：https://blog.csdn.net/joycewyj/article/details/51752690

版权

深度学习笔记专栏收录该内容

1 篇文章 0 订阅

订阅专栏

本文探讨了深度学习的应用，如图像识别和自然语言处理，以及高效的计算基础，如Numpy和Scipy。重点讲解了图像识别的难点和KNN方法，然后转向线性分类器，介绍其得分函数和损失函数。最后，讨论了实践中的图像分类方法，如KNN、SVM和Softmax。

摘要由CSDN通过智能技术生成

七月算法5月深度学习班课程笔记——No.2

1. 深度学习与应用

　　1. 图像上的应用：可以根据图片，识别图片的内容，描述图像；模仿人的创造性生成画作；相册自动归类等。
　　这里写图片描述
　　
　　
　　2. NLP上的应用：用RNN学习某作家的文笔风格进行写作、学习代码写作等。下图为RNN学习了200M的代码量后自动生成的代码片段，代码的格式已经比较相似了。
　　
　　
　　3. 综合应用：识别物体，再根据识别出来的物品组织成文本描述。
　　这里写图片描述

2. 高效计算基础

　　python基本类型、容器等基础的语言知识，请移步：python基础教程
　　Numpy：矩阵运算
　　Scipy：稀疏矩阵求距离。
　　科学计算库的安装与使用可以移步：Python及科学运算库的安装

3. 图像识别难点与KNN

　　图像识别的核心问题：一个图像给计算机输入的是一个矩阵，每一个像素点上都是一个RGB颜色值，根据矩阵去做图像识别，计算置信度。
　　难点：
　　1. 视角不同：每个事物旋转或者侧视最后的构图都完全不同
　　2. 尺寸大小不统一：相同内容的图片也可大可小
　　3. 变形：很多东西处于特殊的情形下，会有特殊的摆放和形状
　　4. 光影等干扰/幻象重点内容
　　5. 背景干扰
　　6. 同类内的差异(比如椅子有靠椅/吧椅/餐椅/躺椅…)
　　图像识别的基本流程：

输入：我们的给定K个类别的N张图片， 作为计算机学习的训练集。
学习：让计算机逐张图片地『 观察』 和『 学习』
评估：就像我们上学学了东西要考试检测一样， 我们也得考考计算机学得如何， 于是我们给定一些计算机不知道
类别的图片让它判别， 然后再比对我们已知的正确答案。

　　K最邻近法（KNN）：K最近邻，就是k个最近的邻居的意思，说的是每个样本都可以用它最接近的k个邻居来代表。KNN算法的核心思想是如果一个样本在特征空间中的k个最相邻的样本中的大多数属于某一个类别，则该样本也属于这个类别，并具有这个类别上样本的特性。
　　KNN做图像识别有一些缺点，比如准确度不高，因为找不到图像合适的特征，而且KNN需要记录全部训练数据。那么可以试试线性分类器，用逻辑回归或者linearSVM。

4. 线性分类器

4.1 线性分类器

　　线性分类器会有一个得分函数，比如CIFAR-10数据集，数据集里有10个类别，每个图像的大小都是32x32，每个像素点有RDB的值，所以总共有32x32x3=3072 个数，线性分类器就是把这些数作为输入，即3072x1的向量，给定权重矩阵W[n*3072]，n是要判定的类别的数量。通过矩阵相乘得到得分函数：
　　

f (x, W) = W x + b

$f(x,W)=Wx+b$
　　其中W是通过训练得到的。那么得到的得分高低就可以判定类别。
　　这里写图片描述

　　线性分类器的理解：
　　1. 空间划分：Wx+b是空间的点。
　　2. 模板匹配：W的每一行可以看做是其中一个类别的模板。每类得分，实际上是像素点和模板匹配度，模板匹配的方式是内积计算。

4.2 损失函数

　　损失函数：由得分函数我们知道，给定W，可以由像素映射到类目得分。损失函数用来评估W、b的好坏，衡量吻合度，可以通过调整参数/权重W，使得映射的结果和实际类别吻合。有两种损失函数：
　　一是hinge loss/支持向量机损失。
　　对于训练集中的第i张图片数据 $x_i$ ，在W下会有一个得分结果向量 $f(x_i,W)$ ，第j类的得分为我们记作 $f(x_i,W)_j$ ，则在该样本上的损失我们由下列公式计算得到：