深度学习-----从零开始实现识别手写字体任务（四）卷积层与池化层

最新推荐文章于 2023-01-09 21:21:53 发布

正正没洗头

最新推荐文章于 2023-01-09 21:21:53 发布

阅读量345

点赞数 1

分类专栏：深度学习-----从零开始实现识别手写字体任务文章标签：卷积神经网络深度学习 tensorflow

本文链接：https://blog.csdn.net/qq_57173265/article/details/118342707

版权

深度学习-----从零开始实现识别手写字体任务专栏收录该内容

6 篇文章 2 订阅

订阅专栏

一.卷积层的作用

在我们识别一个简单图像的时候，会根据图像的特征来确定图像表示的意义。所有第一步我们就是要提取目标的特征，而这一任务就是由卷积层完成的。

二.定义二维卷积函数

二维卷积的原理如图

在这里插入图片描述

二维卷积的原理可以理解为图像与特征图像权重求和的过程，数值越大，图像越具有此特征。

def conv2d(x, W):
    return tf.nn.conv2d(x, W, strides=[1, 1, 1, 1], padding='SAME')

strides=[1, 1, 1, 1]：卷积核在各个维度的移动步长都为一。

padding主要有两个值

SAME：可以不丢弃任何像素点（在矩阵边缘加一圈0）
VALID：丢弃边缘像素点

在这里SAME的作用为：使图像在经过卷积后维度不变

三.定义池化函数

def max_pool_2x2(x):
    return tf.nn.max_pool(x, ksize=[1, 2, 2, 1], strides=[1, 2, 2, 1], padding='SAME')

采用最大池化，也就是取窗口中的最大值作为结果
x 是一个4维张量，shape为[batch,height,width,channels]
ksize表示pool窗口大小为2x2,也就是高2，宽2
strides，表示在height和width维度上的步长都为2

经过池化后可以使图像的维度降低

四.定义卷积层

卷积层1：

W_conv1 = weight_variable([5, 5, 1, 32])  
b_conv1 = bias_variable([32])
# 偏置项，参与conv2d中的加法，维度会自动扩展到28x28x32（广播）
h_conv1 = tf.nn.relu(conv2d(x_image, W_conv1) + b_conv1)  
# output size 28x28x32
h_pool1 = max_pool_2x2(h_conv1)  
# output size 14x14x32 卷积操作使用padding保持维度不变，只靠pool降维

初始化W_conv1为[5,5,1,32]的张量，表示卷积核大小为5*5，1表示图像通道数（输入），32表示卷积核个数即输出32个特征图（即下一层的输入通道数）

一开始输入一个28*28*1的矩阵，经过W_conv1,b_conv1,h_conv1后变为28*28*32的矩阵，使图像变为32个28*28的特征图。之后经过池化层变为32个14*14的特征矩阵图。

卷积层2：

W_conv2 = weight_variable([5, 5, 32, 64])  # 同conv1，不过卷积核数增为64
b_conv2 = bias_variable([64])
h_conv2 = tf.nn.relu(conv2d(h_pool1, W_conv2) + b_conv2) 
# output size 14x14x64
h_pool2 = max_pool_2x2(h_conv2)  
# output size 7x7x64

卷积层2与卷积层1原理相同，不过将卷积核增加为64，每个输入经过池化层之后变为64个7*7的特征图。

正正没洗头

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
3
评论
深度学习-----从零开始实现识别手写字体任务（四）卷积层与池化层

一.卷积层的作用在我们识别一个简单图像的时候，会根据图像的特征来确定图像表示的意义。所有第一步我们就是要提取目标的特征，而这一任务就是由卷积层完成的。二.定义二维卷积函数二维卷积的原理如图二维卷积的原理可以理解为图像与特征图像权重求和的过程，数值越大，图像越具有此特征。def conv2d(x, W): return tf.nn.conv2d(x, W, strides=[1, 1, 1, 1], padding='SAME')strides=[1, 1, 1, 1]
复制链接

扫一扫