本文不会像科技论文那样,详细啰嗦,而是按照解决问题的逻辑思路来写,使得初学者有一个全面的掌握。因为我也是在学习的过程中。本文就只用图来说明,其他人已经写的很多了,我只写比较好看的。
关注公众号,获取更多信息
这篇文章参考了吴恩达老师的网易公开课和相关的论文资料,权当做个笔记,所以没有讲到的及新的知识会在后续跟上。现在各种网络结构泛滥,针对性越来越强,眼花缭乱,但是,我觉得基础的东西是根本,博观而约取。
一些重要的知识点:
(1)卷积的时候,如果图像是层(多通道)的,那么卷积核也必须有多少层,在卷积的时候,将所有层进行对应位置元素乘积相加即可,例如,卷积核大小是3x3,层数为3层,共有3个不同卷积核,那么卷积后输出的结果是个3层的图像。
(2)池化是对每一层分别做池化,而不需要把每层的结果相加
(3)一般卷积、池化、卷积、池化的时候,卷积个数会越来越多,而卷积后的图像维度会越来越小。
(4)一般池化采用最大池化
(5)图像维度下降太快会影响效果
(6)所谓的层是指由参数的层,一般池化层的参数是固定的,不需要学习
(7)关于如何制作训练数据集:旋转,颜色加深活改变,翻转,畸变、扭曲等
1、LeNet-5网络
经典的LeNet网络主要是针对灰度图像。因此有如下的网络结构图。
2、AlexNet
3、VGG
4、GoogleNet
5、ResNet