字符识别模型CNN
学习目标
- 学习CNN原理和基础
- 使用Pytorch框架构建CNN模型并完成训练。
卷积神经网络CNN介绍
CNN:Convolutional Neural Networks。卷积神经网络。是一种前馈网络,某层的神经元之和前一层的神经元有关,可以看作一种有向无环图,在很多领域较全连接模型表现得优异,精度和速度也比传统计算学习算法要高。特别是计算机视觉领域,CNN是解决图像分类、图像检索、物体检测和语义分割的主流模型。
卷积介绍
要想了解卷积神经网络,首先我们需要对卷积有一定的了解(数学原理不做过多概述):
首先我们要知道,图片在计算机中是以矩阵形式存储的,所以我们想要对图片进行一些操作,本质上是对矩阵进行操作。
卷积的根本目的是从输入图片中提取特征。卷积用一个小方阵的数据学习图像特征,可以保留像素之间的空间关系。(保留像素之间的空间关系很重要!)。
我们可以考虑,如果在我们在人的面部表情的图片当中,你看到了一个小圆圈,再向外又看到了一圈椭圆的东西,我们就可以断定这是眼睛了,这是我们通过这个范围得出的结果,我们不需考虑这张图片的其他位置是什么样子的。
而卷积核做的其实就是这样一个操作,是特征提取,在底层的卷积操作提取的特征小,比如一条横线,一条竖线;越向深层提取的特征