CNN卷积神经网络
CNN基础
卷积神经网络主要应用于计算机视觉相关任务,但它能处理的任务并不局限于图像,也可以语音识别。
使用数据:MNIST手写数字,cifar10图像数据以及猫和狗图像识别数据。
当计算机看到一张图像(输入一张图像)时,它看的是一大堆像素值。
当我们人类对图像进行分类时,这些数字毫无用处,可他们却是计算机可获得的唯一输入。
现在的问题是:提供给计算机这一数组后,它将输出描述该图像属于某一特定分类的概率的数字(比如:80%是猫,15%是狗,5%是鸟)
计算机可以通过寻找诸如边缘和曲线之类的低级特点来分类图片,继而通过一系列卷积层级构建出更为抽象的概念。这是CNN(卷积神经网络)工作方式的大体概述。
为什么叫卷积神经网络?
CNN的确是从视觉皮层的生物学上获得启发的。简单来说:视觉皮层有小部分细胞对特定部分的视觉区域敏感。
例如:一些神经元只对垂直边缘兴奋,另一些对水平或对角边缘兴奋。
CNN工作概述指的是挑一张图像,让它历经一系列:
卷积层,
非线性层,
池化(下采样(downsampling))层
和全连接层,
最终得到输出。正如之前所说,输出可以是最好地描述了图像内容的一个单独分类或一组分类的概率。
什么是卷积?
卷积是指将卷积核应用到某个张量的所有点上,通过将卷积核在输入的张量上滑动而生成经过滤波处