CNN是一种深度学习模型,利用卷积层提取图像特征,池化层降维与增强不变性,全连接层实现分类/回归。核心理论包括局部感知、权值共享、多层抽象。广泛应用图像识别、目标检测、语义分割、生成任务等领域。
一、CNN理论基础
1、局部感知野(Local Receptive Fields)
CNN借鉴了生物视觉系统中神经元仅对视野内特定区域敏感的特性,引入局部感知野的概念。在卷积层中,每个神经元仅与其输入数据的一个小窗口(通常为矩形区域)交互,这一窗口被称为卷积核或过滤器(filter)。通过限制神经元的连接范围,CNN能够有效捕捉图像的局部特征,如边缘、纹理、颜色分布等。
2、权值共享(Weight Sharing)
在卷积层中,同一过滤器在遍历整个输入图像时保持其权重不变。这种权值共享机制显著减少了模型参数的数量,同时增强了网络对平移不变性的学习能力,即无论特征出现在图像何处,只要其结构相同,网络都能有效地识别。
3、池化(Pooling)
池化层旨在降低数据维度并提取抽象特征,同时进一步增强模型对微小位移的鲁棒性。常见的池化操作包括最大池化(Max