什么是卷积神经网络?
卷积神经网络(Convolutional Neural Network,CNN)是一种用于图像、语音等高维数据处理的神经网络模型。它的主要特点是通过卷积操作提取输入数据的特征,然后通过池化操作降低特征的维度,最后使用全连接层进行分类或回归等任务。
CNN的核心思想
CNN的核心思想是局部感知性和权值共享。局部感知性指的是卷积操作只关注输入数据的局部区域,而忽略其他区域,这样可以减少模型的参数数量和计算量。权值共享指的是在卷积操作中使用相同的权重对输入数据的不同位置进行卷积,这样可以进一步减少模型的参数数量和计算量。
CNN的基本结构
CNN的基本结构包括卷积层、池化层和全连接层。卷积层用于提取输入数据的特征,池化层用于降低特征的维度,全连接层用于将特征映射到输出空间。在实际应用中,CNN还可以使用多个卷积层和池化层构成深层网络,以进一步提高模型的性能。
CNN的发展领域
CNN在图像分类、目标检测、语音识别等领域取得了很好的效果,成为了深度学习领域的重要技术之一。
LeNet架构
学习表征
- 浅层学习:不涉及特征学习,其特征主要靠人工经验或特征转换方法来抽取
- 表示学习:如果有一种算法可以自动地学习出有效的特征,并提高最终机器学习模型的性能,那么这种学习就可以叫作表示学习
视觉分析理论
- 视觉分层理论,从底层到高层的不断抽象
- 浅层卷积核提取:边缘、颜色、斑块等底层像素特征。
- 中层卷积核提取:条纹、纹路、形状等中层纹理特征。
- 高层卷积核提取:眼睛、轮胎、文字等高层语义特征。
AlexNet架构
- AlexNet的架构与LeNet相似,但使⽤了更多的卷积层和更多的参数来拟合大规模的ImageNet数据集。
- 今天,AlexNet已经被更有效的架构所超越,但它是从浅层⽹络到深层网络的关键一步。
- 新加入了Dropout、ReLU、最大池化层和数据增强