细读CNN及VGG网络结构

吃葡萄不图葡萄皮

于 2024-07-24 10:07:19 发布

阅读量541

点赞数 23

文章标签： cnn 深度学习神经网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_56317802/article/details/140651825

版权

目录

步骤 1：导入所需库

步骤 2：加载和预处理数据集

步骤 3：定义卷积神经网络

步骤 4：定义损失函数和优化器

步骤 5：训练模型

步骤 6：模型评估

VGG16的卷积核

CNN

卷积神经网络（Convolutional Neural Network，CNN）是一种广泛应用于计算机视觉任务的深度学习模型。卷积神经网络是一种专门用于处理具有网格状拓扑结构数据（如图像、声音）的深度学习模型。CNN的核心组件是卷积层和池化层，它们能够有效地从图像中提取特征并实现空间不变性，使得模型能够对图像中的物体进行识别和分类。

卷积神经网络主要是由输入层、卷积层、激活函数、池化层、全连接层、损失函数组成，表面看比较复杂，其实质就是特征提取以及决策推断。

卷积的作用就是提取特征，因为一次卷积可能提取的特征比较粗糙，所以多次卷积，以及层层纵深卷积，层层提取特征（千万要区别于多次卷积，因为每一层里含有多次卷积）。

为什么要用激活函数？它的作用是什么？如果不用激活函数，每个网络层的输出都是一种线性输出，而我们所处的现实场景，其实更多的是各种非线性的分布。这也说明了激活函数的作用是将线性分布转化为非线性分布，能更逼近我们的真实场景。

池化层一般在卷积层+ Relu之后，它的作用是： 1、减小输入矩阵的大小（只是宽和高，而不是深度），提取主要特征。（不可否认的是，在池化后，特征会有一定的损失，所以，有些经典模型就去掉了池化这一层）。目的是显而易见的，就是在后续操作时能降低运算。2、一般采用mean_pooling（均值池化）和max_pooling（最大值池化），对于输入矩阵有translation（平移），rotation（旋转），能够保证特征的不变性。mean_pooling 就是输入矩阵池化区域求均值，这里要注意的是池化窗口在输入矩阵滑动的步长跟stride有关，一般stride

最低0.47元/天解锁文章

吃葡萄不图葡萄皮

关注

23
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
细读CNN及VGG网络结构

卷积神经网络（Convolutional Neural Network，CNN）是一种广泛应用于计算机视觉任务的深度学习模型。VGG很好的继承了Alexnet的衣钵同时拥有着鲜明的特点。
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。