1)CNN基础
前面我们讲解了机器学习基础知识,包括多层感知器等问题。
下面我们要介绍的目标识别与分类,就是在前面问题的基础
上进行扩展,实现对于图像等分类和识别。
实现对图像的高准确率识别离不开一种叫做卷积神经网络的深度学习技术。
卷积神经网络主要应用于计算机视觉相关任务,但它能处理的任务并不局限于图像,其实语音识别也是可以使用卷积神经网络。
将带大家使用识别Mnist手写数字、 cifar10图像数据以及猫和狗图像识别数据来让大家对于卷积神经网络有一个大概的了解。
2)什么是卷积神经网络
当计算机看到一张图像(输入一张图像)时,它看的是一大堆像素值。
当我们人类对图像进行分类时,这些数字毫无用处,可它们却是计算机可获得的唯一输入。
现在的问题是:当你提供给计算机这一数组后,它将输出描述该图像属于某一特定分类的概率的数字(比如: 80% 是猫、 15% 是狗、 5%是鸟)。
我们人类是通过特征来区分猫和狗,现在想要计算机能够区分开猫和狗图片, 就要计算机搞清楚猫猫狗狗各自的特有特征。
计算机可以通过寻找诸如边缘和曲线之类的低级特点来分类图片,继而通过一系列卷积层级建构出更为抽象的概念。这是 CNN(卷积神经网络)工作方式的大体概述。
3)为什么叫卷积神经网络?
CNN 的确是从视觉皮层的生物学上获得启发的。
简单来说:视觉皮层有小部分细胞对特定部分的视觉区域敏感。
例如:一些神经元只对垂直边缘兴奋,另一些对水平或对角边缘兴奋。
4)CNN工作概述
CNN 工作概述指的是你挑一张图像,让它历经一系列
卷积层、
非线性层、
池化(下采样(downsampling))层
和全连接层,
最终得到输出。正如之前所说,输出可以是最好地描述了图像内容的一个单独
分类或一组分类的概率。
5)什么是卷积?
卷积是指将卷积核应用到某个张量的所有点上,通过将卷积核在输入的张量上滑动而生成经过滤波处理的张量。
1、一个卷积核提取特征的例子:图像的边缘检测
一个卷积核
应用到图像的每个像素,结果输出一个刻画了所有边缘的新图像
总结起来一句话:
卷积 完成的是 对图像特征的提取 或者说 信息匹配
当一个包含某些特征的图像经过一个卷积核的时候,一些卷积核被激活,输出特定信号。