Task3-字符识别模型(卷积神经网络)
1 卷积神经网络原理
定义
- 卷积神经网络由一个或多个卷积层、池化层以及全连接层等组成。与其他深度学习结构相比,卷积神经网络在图像等方面能够给出更好的结果。这一模型也可以使用反向传播算法进行训练。相比较其他浅层或深度神经网络,卷积神经网络需要考量的参数更少,使之成为一种颇具吸引力的深度学习结构。
其中主要包含了几个主要的结构:
- 卷积层(Convolutions)
- 池化层(subsampling)
- 全连接层(Full connection)
- 激活函数
1.1 卷积层
-
目的
- 卷积运算的目的是提取输入的不同特征,某些卷积层可能只能提取一些低级的特征如边缘、线条和角等层级,更多层的网路能从低级特征中迭代提取更复杂的特征。**(提取特征,检测边缘,降维)*
-
参数:
- size: 卷积核的大小
- padding:零填充(对边缘填充),valid与same
- stride:步长,通常是1
-
计算公式:
- 图片的体积:(H1&