背景简介
要深入理解卷积神经网络的结构,我们需要追根溯源,只有这样才能更好的理解 CNN 网络。
1998年 LeCun 和 Bengio 等人利用 LeNet-5 网络在手写体数字识别领域上的识别效果超过了传统方法,从此开启了卷积神经网络的在图像上的应用大门。据说,一开始美国银行的手写体数字识别就是用的这个算法。
原论文
Gradient -Based Learing Applied to Document Recognition
http://yann.lecun.com/exdb/publis/pdf/lecun-98.pdf
论文有点长,46页,估计很难读下来。
官方模型演示
LeCun 做了一些网页展示,有兴趣可以去浏览。
http://yann.lecun.com/exdb/lenet/
个人 github 实现
https://github.com/uestcsongtaoli/LeNet-5
个人理解
1. 模型介绍
上图是 LeCun 原论文中 LeNet-5 的结构图。
- 卷积层 C1
Conv2D(filters=6, kernel_size=(5, 5)