深度学习属于机器学习的分支。类似于生物学上的神经元,人类能产生多种视觉,嗅觉,听觉都是无数神经元的作用,深度学习模型也包含很多神经元,这些神经主要包含三部分:输入层,隐藏层,输出层。其中隐藏层最复杂。
在CV领域主要用到的是卷积神经网络,一个经典的卷积神经网络包括输入层,卷积层,池化层和输出层。
输入层:
图像输入,即二维数组的输入,若是多通道的图像则是三维数组的输入。
卷积层:
在传统图像处理中,就有卷积的概念,在频域中都是做卷积运算。在深度学习中,卷积层即使用一个卷积核kernal和原始图像做卷积运算,卷积的过程既是提取图像特征的过程。
池化层:
池化层主要用来降采样,降低数据的规模,加快训练的速度