卷积神经网络(CNN)——简介
一、简介
卷积神经网络(ConvNets或CNN)是神经网络的一种,已被证明在图像识别和分类等领域非常有效。 除机器人和自动驾驶汽车的视野增强外,ConvNets还在识别面部,物体和交通标志上获得成功。
LeNet是最早推动深度学习领域的卷积神经网络之一。 自1988年以来,Yann LeCun的这项开创性工作在经过多次成功的迭代之后,于1998年被命名为LeNet5。 当时LeNet架构主要用于字符识别任务,例如读取邮政编码,数字等。
二、LeNet网络结构
上图为经典神经网络LeNet的网络结构,其中包括了卷积神经网络的四个关键操作:
持续更新,后续会详细介绍每个操作。
三、图像的存储
通道是一个常规术语,用于指代图像的某个组成部分。 来自标准数码相机的图像将具有三个通道-红色,绿色和蓝色。可以把它们想象成三个彼此叠加的二维矩阵(每种颜色一个),每个像素值的范围为0到255,其中0显示黑色,255显示白色。
如果是灰度图的话,则只有一个通道 。
所以在计算机中,图像是都被表示成一个像素值矩阵,对于一个长宽都为20像素的彩色图像,存储的数据格式为(20,20,3);对于一个长宽都为20像素的灰度图,存储的数据格式为(20,20,1)。