VGG论文学习心得

最新推荐文章于 2022-11-16 19:20:42 发布

Pandoroda

最新推荐文章于 2022-11-16 19:20:42 发布

阅读量2.8k

点赞数

分类专栏：神经网络基础文章标签： cnn 深度学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_39421203/article/details/122702142

版权

本文详细探讨了VGG网络的结构，包括卷积层、池化层和全连接层的设计，以及VGG16和VGG19的差异。在训练参数方面，介绍了批大小、动量、正则化、dropout和学习率策略。通过多尺度训练和池化策略，确保模型能够适应不同分辨率的图像。实验结果显示，网络层数增加能降低错误率，而模型集成如多尺度评估和裁剪方法能进一步提升性能。

摘要由CSDN通过智能技术生成

一、网络结构

基本概念

如果输入的是一个RGB图像，那么就会有3个通道。“channel”通常被用来描述“layer”的结构。相似的，“kernel”是被用来描述“filter”的结构。

来自 <深度学习中的各种卷积_滤波器>

输入是一个5x5x3的矩阵，有三个通道。filter是一个3x3x3的矩阵。首先，filter中的每个卷积核分别应用于输入层中的三个通道。执行三次卷积，产生3个3x3的通道。

然后，这三个通道相加（矩阵加法），得到一个3x3x1的单通道。这个通道就是在输入层（5x5x3矩阵）应用filter（3x3x3矩阵）的结果。

卷积神经网络大小固定在224*224RGB大小，并对其进行预处理：average(图像像素数据-RGB值)，将图片放在卷积神经网络（3*3）里面进行计算，池化是2*2 步长为2，卷积的步长为1

</

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。