目录
卷积神经网络简介
其组成部分
输入层
卷积层
池化层
全连接层
CNN 在数据集上的实际实现
CNN简介
卷积神经网络是一种专为处理图像和视频而设计的深度学习算法。它以图像为输入,提取和学习图像的特征,并根据学习到的特征进行分类。
该算法的灵感来自于人脑的一部分,即视觉皮层。视觉皮层是人脑的一部分,负责处理来自外界的视觉信息。它有不同的层,每一层都有自己的功能,即每一层从图像或任何视觉中提取一些信息,最后将从每一层接收到的所有信息组合起来,对图像/视觉进行解释或分类。
同样,CNN有各种滤波器,每个滤波器从图像中提取一些信息,例如边缘、不同种类的形状(垂直、水平、圆形),然后将所有这些组合起来识别图像。
现在,这里的问题可能是:为什么我们不能将人工神经网络用于相同的目的?这是因为ANN有一些缺点:
对于 ANN 模型来说,训练大尺寸图像和不同类型的图像通道的计算量太大。
它无法从图像中捕获所有信息,而 CNN 模型可以捕获图像的空间依赖性。
另一个原因是人工神经网络对图像中物体的位置很敏感,即如果同一物体的位置或地点发生变化,它将无法正确分类。
CNN的组成部分
CNN模型分两步工作:特征提取和分类
特征提取是将各种过滤器和图层应用于图像以从中提取信息和特征的阶段,完成后将传递到下一阶段,即分类,根据问题的目标变量对它们进行分类。
典型的 CNN 模型如下所示:
输入层
卷积层+激活函数
池化层
全连接层