在了解完神经网络之后,下一个要了解的就是深度学习。深度学习当中最常用的方法就是深度卷积网络。比起神经网络来说,深度卷积网络的优点在于对特征值进行计算而不是对原始值进行计算。
例如,人类在识别一个小狗的图像的时候,从来不会一个一个像素的思考这只狗是不是小狗,只要看到小狗的四条腿、皮毛的特征的时候就知道是小狗,相对来说计算量大幅度降低。
对于传统的神经网络来说,所有的数据是一股脑计算的,因而不仅计算量大,还会出现过拟合的现象。(过拟合指的是仅仅能识别输入的图像,换了一个别的狗就认不出来了。)
因而深度卷积网络的意思就是先进行特征提取,再进行运算。
总的来说,分为三个层:卷积层、池化层、全连接层。
卷积层的功能:利用卷积核进行计算。计算的目的是得到特征值,这些特征值将构成一个特征图。
原理:卷积层利用一个窗口进行计算,例如一张小狗的图片规模是200*200,如果我们设置一个20*20的卷积核,就将会得到180*180的特征图。所谓的卷积核就是一个矩阵数组,它将和原始图片上的矩阵数据进行计算。因而每次计算,都将会对20*20窗口上的图像内容进行抽象。这样说比较抽象,可以看文后的连接。
每个卷积网络都会有很多卷积层。以小狗为例,它可能有3个卷积层:一个用来检测四条腿,一个用来检测皮毛,一个用来检测狗头。每当卷积层进行计算时,检测到的数值会被放大。当完成所有的特征图的时候,可以想象第一张图应该只能看到狗腿,第二张图只能看到一片模糊的毛,第三张图看到一个狗头。
因而,经过卷积计算之后,我们得到了三张特征图&#